适合人群
- 正在使用 OpenClaw 搭建 AI Agent 系统的开发者
- 想让 AI Agent 接入语音通话和视频会议的团队
- 关注 DeepSeek V4 模型集成的 AI 应用开发者
- 用 OpenClaw 做浏览器自动化和 MCP 集成的技术团队
准备清单
- 已安装 OpenClaw 或正在评估部署
- 了解基本的 OpenClaw 配置和插件系统
- Node.js 18+ 环境
OpenClaw 2026.4.24 更新概览
OpenClaw(364k Star)于 2026 年 4 月 24 日发布新版,距离上一次更新仅一天。这次更新聚焦三大方向:语音视频能力全面升级、DeepSeek V4 模型集成、浏览器自动化增强。同时包含大量插件基础设施优化和稳定性修复。
重点新功能
1. Google Meet 正式集成
这是本次更新最大的亮点。Google Meet 现在作为内置参与者插件加入 OpenClaw。
核心能力:
- 个人 Google 账号 OAuth 认证,无需企业账号
- 通过 Chrome 或 Twilio 建立 realtime 音频会话
- 支持 Parallels 虚拟机环境下的 paired-node Chrome 运行
- 会议产物导出:录音、转录、智能笔记
- 参会者出勤记录导出
- 已打开的 Meet 标签页恢复工具
使用场景:
- AI Agent 自动参加 Google Meet 会议并做记录
- 实时会议中 Agent 可以回答问题、查询数据
- 会后自动生成会议纪要和待办事项
配置命令:
# 检查 Google Meet OAuth 状态
openclaw googlemeet doctor --oauth
# 恢复已打开的 Meet 标签页
openclaw googlemeet recover-tab
2. DeepSeek V4 Flash + Pro 入场
DeepSeek V4 的两个版本正式加入 OpenClaw 内置模型目录:
- DeepSeek V4 Flash:成为新用户默认模型(替代之前的默认选项)
- DeepSeek V4 Pro:高级版本,适合需要更强推理能力的场景
关键修复:
- DeepSeek 的思考/回放(thinking/replay)行为在后续工具调用轮次中被修复
- Pi 包升级到 0.70.2,使用上游的 gpt-5.5 和 DeepSeek V4 目录元数据
对用户的影响: 新安装的 OpenClaw 会默认使用 DeepSeek V4 Flash 作为初始模型,入门成本更低(DeepSeek API 价格远低于 Claude/GPT)。
3. 语音通话升级:Agent 全能力接入
这是架构层面的重大改进。以前语音通话只能用有限的工具能力,现在 Talk、Voice Call 和 Google Meet 都能使用 realtime 语音循环,直接调用完整的 OpenClaw Agent。
这意味着什么: 在电话或会议中,AI 不再是"只能聊天"——它可以调用浏览器、执行代码、查询数据库、操作文件系统,所有 Agent 工具都能通过语音触发。
具体改进:
openclaw_agent_consult共享工具:语音通话中可以请求完整的 Agent 协助voicecall setup+voicecall smoke:通话前检查 Twilio/服务商就绪状态- Gemini Live 实时语音桥接:后端语音通话和 Google Meet 音频桥接使用 Google Gemini Live
- WebRTC 实时语音:Control UI/Talk 通过 OpenAI Realtime 提供 WebRTC 实时语音
4. 浏览器自动化增强
四个实用改进:
坐标点击
支持在浏览器中按视口坐标点击,不再局限于 CSS 选择器匹配。
# CLI 使用坐标点击
openclaw browser click-coords --x 500 --y 300
更长的默认操作超时
默认操作预算从之前的短超时提升到 60 秒。复杂页面加载不再频繁超时失败。
Per-Profile 无头模式
不同浏览器配置可以独立设置 headless 模式,不用一刀切。
# config.yaml
browser:
profiles:
scraper:
headless: true
debug:
headless: false
标签页复用和恢复
浏览器标签页的复用和恢复机制更稳定,减少重复打开标签页的问题。
5. TTS 语音合成:Gradium 内置
新增内置文本转语音(TTS)提供者 Gradium,支持语音笔记和电话音频输出。不再需要外部 TTS 服务。
配合 Claude Pro 使用可以获得更完整的语音体验。
插件基础设施大改造
这次更新对插件系统做了深度重构,虽然对普通用户不直接可见,但对开发者和长期维护非常重要:
静态模型目录
模型列表不再需要加载所有 Provider 运行时就能生成。使用静态目录 + manifest 声明,启动速度快很多。
Manifest 驱动的模型行
新增 modelCatalog 契约,Provider 可以声明自己的模型行、别名、抑制规则和发现模式,不需要加载插件运行时。
延迟加载依赖
插件依赖改为按需加载。比如 node-llama-cpp 不再默认安装,只有使用本地嵌入时才安装。
Setup API 规范化
插件 setup 流程全面规范化:
setup.requiresRuntime: false明确声明不需要运行时- 描述符和运行时的不一致会被报告但不会拒绝
- Provider 认证方式从 manifest 直接发现
OTEL 可观测性
新增 OpenTelemetry 诊断支持:
- 运行、模型调用、工具执行的完整生命周期事件
- 可选的内容捕获(默认关闭)
- 轻量级 trace-context 传递
- 进程执行诊断(不暴露命令文本和工作目录)
对企业用户来说,这意味着 OpenClaw 现在可以被标准化的可观测性工具链监控。
重要修复
心跳系统
- 修复了心跳系统提示词被注入到非心跳运行中的问题(#69079)
- 大延迟调度器现在通过安全定时器辅助函数限制,防止超过 Node 超时上限导致崩溃循环(#71414)
MCP 会话泄漏
MCP 运行时会在运行结束时正确退休,空闲会话通过 mcp.sessionIdleTtlMs 配置自动驱逐。
子 Agent 稳定性
- 停止的过期运行不再永远被计为活跃或待处理(#71252)
- 子 Agent 在可恢复的传输失败后自动恢复(#71423)
- 旧的反向链接不再在 childSessions 中重新出现(#57920)
平台修复
- Telegram:Agent 已回复后不再发送"couldn't generate a response"幽灵消息
- Discord:Cron 和心跳输出不再重复发送
- Feishu:流式卡片创建 HTTP 400 后自动退避;话题群组会话按 thread_id 正确聚合
- Signal:Linux signal-cli 语音笔记的 MIME 类型正确解析
- WhatsApp:
[[audio_as_voice]]语音笔记意图在所有发送路径中正确保留 - macOS Gateway:launchd 重启竞态条件修复(#45178, #41934)
安全修复
- Dashboard 不再将带 Token 的 URL 和 SSH 提示写入日志(#70029)
- 浏览器请求方法需要
operator.admin权限 - WeCom 渠道源锁定到精确的 npm 版本 + 完整性校验
破坏性变更
Plugin SDK 工具结果转换: 移除了 Pi 专用的 api.registerEmbeddedExtensionFactory(...) 兼容路径。必须改用 api.registerAgentToolResultMiddleware(...) 配合 contracts.agentToolResultMiddleware。
如果你有自定义插件使用了旧的 API,需要更新。
升级指南
# 全局安装最新版
npm install -g openclaw@latest
# 验证版本
openclaw --version
# 运行诊断
openclaw doctor --fix
如果你使用 DeepSeek V4 Flash 作为新默认模型,确保你的 DeepSeek API Key 已配置:
# 设置 DeepSeek API Key
export DEEPSEEK_API_KEY="sk-..."
常见问题
Q: 2026.4.24 和 2026.4.23 有什么区别?
4.23 是大规模安全加固版本,4.24 是功能增强版本,重点在语音视频和模型集成。两个版本可以连续升级。
Q: Google Meet 集成需要付费吗?
OpenClaw 本身免费。但 Twilio 实时传输需要 Twilio 账号,通话费用按 Twilio 标准计费。Chrome 传输方式完全免费。
Q: DeepSeek V4 Flash 作为默认模型,效果够用吗?
对于日常对话和简单任务足够。复杂编程和推理任务建议切换到 Claude Opus 或 GPT-5.5 Pro。
Q: 语音通话中调用 Agent 全能力,安全性怎么保证?
语音触发的工具调用遵循和文字触发相同的安全策略(审批机制、工具白名单等)。建议在生产环境中配置好工具权限。
Q: 插件 SDK 破坏性变更影响大吗?
只影响使用了 registerEmbeddedExtensionFactory 的自定义插件开发者。大多数用户不受影响。
参考来源
下一步建议
- 想了解上一个版本?→ OpenClaw 2026.4.23 更新指南
- 想了解 AI Agent 架构?→ Sub-Agent vs Agent Team 选型指南
- 用 Claude Code 做开发?→ Claude Code 完整教程
- 想在国内使用?→ Claude Code 国内配置教程
- 需要 Claude Pro?→ Claude Pro 月卡
