适合人群
- 正在使用 OpenClaw 的开发者和运维人员
- 通过 Telegram/Discord/Slack/WhatsApp 运行 AI Agent 的团队
- 关注 AI Agent 安全加固的技术负责人
- 想了解 GPT-5.5 集成进展的 AI 应用开发者
准备清单
- 已安装 OpenClaw 或正在评估部署
- 了解基本的 OpenClaw 配置和命令
- Node.js 18+ 环境
OpenClaw 2026.4.23 更新概览
OpenClaw(364k Star 的开源 AI Agent 框架)于 2026 年 4 月 23 日发布新版。这是 2026 年以来更新量最大的一个版本,涵盖 10+ 项新功能和 50+ 项修复,重点包括 GPT-5.5 集成、图片生成能力大幅增强、Sub-Agent 分叉上下文、全平台安全加固。
重点新功能
1. 图片生成能力全面升级
这是本次更新最实用的改进。三个维度同时突破:
Codex OAuth 直出图片
OpenAI 的 gpt-image-2 模型现在可以通过 Codex OAuth 直接生成图片,不再需要单独配置 OPENAI_API_KEY。
# 之前:需要配置 OpenAI API Key
export OPENAI_API_KEY="sk-..."
# 现在:用 Codex OAuth 就行,零额外配置
# OpenClaw 自动通过 Codex 认证路由图片生成请求
OpenRouter 图片生成
通过 OpenRouter 的 image_generate 工具,可以直接调用 OpenRouter 支持的图片模型,只需 OPENROUTER_API_KEY。
图片生成精细控制
Agent 现在可以指定:
- 输出质量和格式(PNG/JPEG/WebP)
- 背景色
- 压缩质量
- 内容审核级别
- 用户标签
这些参数通过 image_generate 工具传递,让 AI 生成的图片更符合具体需求。
2. Sub-Agent 分叉上下文(Forked Context)
sessions_spawn 现在支持可选的上下文继承。以前 Sub-Agent 只能在完全隔离的环境中运行,现在可以选择让子 Agent 继承父 Agent 的对话记录。
为什么重要? 之前如果想让子 Agent 了解对话背景,需要手动把上下文塞进 prompt。现在一行配置搞定:
- 默认行为不变:隔离上下文(安全且可预测)
- 按需开启:子 Agent 继承父 Agent 的对话记录
- 适用于需要上下文感知的复杂任务链
3. GPT-5.5 正式集成
Pi 依赖升级到 0.70.0,使用 Pi 上游的 gpt-5.5 目录元数据。OpenClaw 现在正确识别和路由 GPT-5.5 系列模型:
gpt-5.5:标准版gpt-5.5-pro:专业版(本地前向兼容处理)
Codex 渠道的 openai-codex/gpt-5.5 OAuth 模型行也会自动合成,不会因为 Codex 目录发现遗漏而报 Unknown model 错误。
4. 工具超时可配置
图片、视频、音乐、TTS 生成工具现在支持按调用设置超时时间(timeoutMs)。之前所有生成请求共用一个超时配置,复杂图片生成经常超时失败。
# 简单图标生成:30 秒够
timeoutMs: 30000
# 复杂场景图片:可能需要 2 分钟
timeoutMs: 120000
5. 本地嵌入上下文可配置
Memory 本地嵌入的上下文大小现在可以在配置中调整(memorySearch.local.contextSize,默认 4096)。低配机器可以调小避免内存溢出,高配机器可以调大提升搜索精度。
平台体验优化
Telegram 改进
修复了一个困扰许久的问题:当模型或工具输出 `` 格式的图片时,Telegram 群组不再回退为纯文本 URL,而是正确渲染为图片消息。
Slack 改进
群组 DM 现在被正确分类为群聊上下文,工具调用和计划进度的详细日志不再泄露到群聊中。
WhatsApp 改进
- 首次设置流程优化:运行时依赖加载与 UI 展示解耦,QuickStart 安装包可以更快展示 WhatsApp 配置界面
- 媒体发送统一化:直接发送和自动回复使用相同的媒体标准化流程
Discord 改进
- 原生斜杠命令频道策略不再绕过配置的 owner/member 限制
- 回复消息的权限上下文在整个发送链路中保持一致
WebChat 和 Control UI
图片持久化
Assistant 生成的图片现在作为认证托管媒体持久化。重新加载 WebChat 历史记录时,之前生成的图片依然可见,不再丢失。
停止按钮修复
跨 Gateway 重连期间排队的停止请求会在重连后正确执行,而不是只清除本地 UI 状态。
错误展示
计费、认证、速率限制等不可重试的 Provider 错误现在会在 WebChat 中正确展示,而不是只记录日志。
安全加固(重点)
这个版本包含了一次大规模安全审计,修复了 20+ 个安全问题:
认证与权限
- MCP 工具权限隔离:ACPX OpenClaw 工具桥不再向非 owner 的 MCP 调用者暴露 owner 专属工具(如 cron),堵住了权限提升路径
- Gateway 配置白名单:Agent 驱动的配置修改现在只允许修改白名单内的路径(prompt、model、mention-gating),而非依赖黑名单排除敏感键
- Webhook Secret 热刷新:重新加载密钥后立即生效,无需重启 Gateway
- 审批机制显式启用:不再自动启用审批客户端,必须显式配置
平台安全
- Android:外部 App 的 ASK_OPENCLAW Intent 只预填草稿,不自动发送;明文连接仅限 loopback
- Teams:共享 Bot Framework audience token 必须命名配置的 Teams app ID,阻止跨 Bot token 重放
- Discord:斜杠命令频道策略正确执行 owner/member 限制
- WhatsApp:联系人/vCard/位置信息中的结构化文本不再注入消息正文,通过独立的元数据 JSON 渲染
- 群聊:频道来源的群名和参与者标签不再注入系统提示词
凭证安全
- Windows:文件型密钥自动去除 UTF-8 BOM;ACL 检查默认拒绝,除非显式信任
- Claude CLI:
bypassPermissions从 OpenClaw 的 YOLO 执行策略派生,而非独立配置 - Pairing:移动配对要求私有 IP 或 loopback,不再把
.local或无点主机名视为安全明文端点
其他安全修复
- QQBot
/bot-approve需要框架认证 - 非协议附件 URL(非 HTTP/HTTPS)在媒体获取前被拒绝
- 图片生成工具的 override 值中的 MEDIA: 指令注入被转义
- 插件
setup-api不再回退到启动目录查找
Codex 相关修复
多个 Codex 适配器问题被修复:
- Windows 上
codex.cmdshim 通过 PATHEXT 正确解析 - Codex 媒体理解通过有界的 app-server 图片轮次支持
- Codex provider 元数据在添加模型时被正确保留
- 图片编辑使用 multipart 上传替代 JSON data URL(修复复杂多引用编辑)
- 嵌入式 harness 选择按会话固定,不会在会话中间热切换
request_user_input提示正确路由回原始聊天
记忆系统改进
MEMORY.md 规范化
memory.md(小写)不再作为运行时回退。所有持久记忆统一使用 MEMORY.md。openclaw doctor --fix 会自动合并分裂文件。
Dreaming 独立运行
记忆 dreaming(梦境整理)不再依赖 heartbeat。即使 heartbeat 被禁用,dreaming 也会作为独立的轻量级 Agent turn 运行。
QMD 集合修复
启动修复发现过时的 QMD 集合名称已被占用时会自动重建,记忆搜索不再意外索引整个 workspace 的 markdown 文件。
升级指南
# npm 全局安装最新版
npm install -g openclaw@latest
# 验证版本
openclaw --version
# 运行诊断并自动修复已知问题
openclaw doctor --fix
openclaw doctor --fix 会处理:
- 分裂的 MEMORY.md 文件合并
- 过时的 dreaming cron 配置迁移
- 其他已知的配置问题
常见问题
Q: 从旧版升级会有破坏性变更吗?
配置层面的破坏性变更很少。安全相关的变更大多是"收紧默认行为"——如果你的部署之前依赖宽松的默认值,可能需要显式配置。建议升级后运行 openclaw doctor --fix。
Q: GPT-5.5 需要额外配置吗?
如果你已经配置了 OpenAI Codex OAuth,GPT-5.5 会自动可用。不需要额外的 API Key 或配置。
Q: Sub-Agent 分叉上下文是默认开启的吗?
不是。默认行为仍然是完全隔离。你需要在 sessions_spawn 时显式开启上下文继承。
Q: 安全加固会影响现有功能吗?
大多数安全修复是"收紧默认行为"——更严格的验证、更小的攻击面。正常使用场景不受影响。如果你有特殊的网络配置(如 LocalAI/LAN 端点),可能需要显式启用 private-network SSRF opt-in。
Q: 图片生成需要什么条件?
两种方式任选:Codex OAuth(无需额外 Key)或 OpenRouter API Key。图片质量和格式可以在生成时指定。
参考来源
下一步建议
- 想了解 AI Agent 架构?→ Sub-Agent vs Agent Team 选型指南
- 用 Claude Code 做开发?→ Claude Code 完整教程
- 想在国内使用?→ Claude Code 国内配置教程
- 想了解 acpx 多 Agent 编排?→ acpx v0.6.0 更新指南
- 需要 Claude Pro?→ Claude Pro 月卡
