如果只看标题,OpenAI 在 2026 年 5 月 14 日发布的 Codex 手机端预览,好像只是“ChatGPT App 里多了一个 Codex 入口”。但真正值得注意的不是入口本身,而是它背后的工作流变化:手机可以连接正在运行 Codex 的桌面或远程环境,查看任务、继续对话、审批命令、审查 diff,甚至切换到 GPT-5.5 这类更强的编码模型。
再把 Codex Computer Use 放进来,事情就更有意思了。Codex 不再只是命令行里改代码、跑测试的工具,它开始具备观察屏幕、点击、输入、操作桌面应用的能力。也就是说,一个完整链路正在成型:手机上的 ChatGPT 负责远程调度,桌面端 Codex 负责执行,本地 GUI 由 Computer Use 接管,底层模型由 GPT-5.5 这类强推理、强工具调用模型驱动。
这也是为什么我觉得,之前很火的“小龙虾”OpenClaw,会被 OpenAI 官方能力强烈挤压。这里先说清楚:“取代”不是说 OpenClaw 明天就没有价值,而是说它最吸引普通用户的那部分通用遥控能力,正在被官方产品直接覆盖。
公开信息能确认什么?
先把事实和判断分开。公开资料里能够确认的部分主要有几件事。
第一,Codex 已进入 ChatGPT 手机端研究预览。OpenAI 官方文章明确说明,用户可以在 ChatGPT mobile app 里使用 Codex,连接 Mac、Mac mini 或远程开发环境中正在运行的 Codex,会话可以在手机上继续跟进。
第二,手机端不只是“看进度”。官方介绍里提到,手机端可以查看线程、监控任务、发 follow-up、审查代码差异、批准命令,也可以启动新的云端任务。这意味着 Codex 的工作流从“坐在电脑前盯着终端”,变成了“人可以离开电脑,但仍然在关键节点做确认”。
第三,Codex 可以连接远程环境。官方提到可连接本地 Mac、Mac mini,也可以通过 SSH 等方式连接远程开发环境。对独立开发者来说,这一点很关键,因为很多人本来就有一台远程机器、家里的 Mac mini 或常驻在线的开发环境。
第四,Computer Use 让 Codex 能操作 GUI。OpenAI 的 Codex 文档把 Computer Use 描述为一个用于操作不方便通过 MCP、CLI 或浏览器自动化完成的应用的插件。在 macOS 场景下,它可以观察屏幕状态、点击、输入,并和图形界面交互。
第五,GPT-5.5 给这套链路补上了模型能力。OpenAI 在 GPT-5.5 发布文章里强调了它在复杂多步骤任务、工具使用、编码和长程工作上的提升。对 Agent 来说,模型越能稳住长链路,桌面操控和远程执行才越像真正的生产力,而不是一次性的炫技。
OpenClaw 之前为什么会火?
OpenClaw 的吸引力,在于它把“本地电脑上的 AI Agent”包装成一个更容易远程触发、更容易接入日常消息渠道的系统。它的公开文档强调开源、本地优先、Computer Use、多渠道消息接入、MCP、技能、权限系统和本地记忆。这些东西组合在一起,本质上是在回答一个问题:我能不能不坐在电脑前,也让 AI 去操作我的电脑、处理我的任务?
这个方向当然有吸引力。很多人的真实需求不是“再多一个聊天框”,而是“我在手机上发一句话,电脑那边自动打开软件、整理文件、跑脚本、查资料、发消息、执行某个流程”。OpenClaw 这样的项目刚好踩中了这个点,所以它会被讨论、被转发、被拿来折腾。
但问题也在这里:当 OpenAI 官方把 ChatGPT App、Codex、GPT-5.5、Computer Use 和远程连接串起来以后,OpenClaw 的核心卖点会受到正面冲击。
为什么官方链路会压缩 OpenClaw 的空间?
第一,入口被官方拿走了。OpenClaw 最大的价值之一,是把手机或聊天软件变成桌面 Agent 的入口。现在 ChatGPT App 自己就能连接 Codex,会话、审批、diff、任务状态都在官方应用里闭环。对普通用户来说,少装一个第三方入口、少配一套中间层,就是巨大的优势。
第二,执行层被 Codex 接住了。OpenClaw 如果要成为“能干活的电脑 Agent”,需要自己处理任务执行、工具调用、权限边界、GUI 自动化、上下文保持等问题。而 Codex 本来就是 OpenAI 面向开发者和工程任务打造的执行层,它能读代码、改文件、跑命令、处理 diff,再加上 Computer Use 后,覆盖面会明显扩大。
第三,模型能力被 GPT-5.5 拉高了下限。桌面自动化不是简单的点击脚本,它需要理解目标、拆任务、遇到异常能恢复、知道什么时候要问人。GPT-5.5 这类模型越强,第三方项目靠“接入多个模型 + 外壳编排”形成的差异就越难维持。除非第三方项目在流程、生态、隐私或部署方式上有独特价值,否则很容易被官方能力追上。
第四,信任和安全会天然偏向官方产品。能操作桌面的工具,本质上很敏感。它可能看到屏幕内容,可能点击按钮,可能执行命令,可能接触文件和凭据。普通用户在这类场景里会更倾向于选择权限边界、产品体验、更新维护和安全说明更完整的官方方案。
第五,维护成本不在一个量级。Computer Use、Codex、ChatGPT App、模型更新、远程连接、审批体验,这些东西都需要长期迭代。开源项目可以很灵活,但要持续追赶官方产品的完整体验,难度会越来越大。
真正变化的是工作流
过去我们使用 AI 编程工具,大多是这样的:
人坐在电脑前 -> 打开 IDE 或终端 -> 调用 AI -> 等它修改 -> 人检查结果
而这次 OpenAI 给出的方向更像这样:
手机发起或跟进任务 -> 远程 Codex 执行 -> 必要时申请人类审批 -> 桌面应用由 Computer Use 操作 -> 人在手机上审查结果
这一步很重要。AI Agent 的价值不只是“模型回答更聪明”,而是它能不能嵌进人的真实工作流。手机端让人不必一直守在电脑前,远程环境让任务可以持续运行,审批机制让高风险操作不会完全脱离人的控制,Computer Use 则补上了“很多软件没有 API、没有 CLI、不能只靠网页自动化”的缺口。
几个很现实的使用场景
1. 出门在外审批 Codex 命令。比如你让 Codex 在远程机器上修一个网站 bug,它需要安装依赖、跑测试、修改文件。以前你可能要远程桌面或等回到电脑前,现在可以在手机上看它要执行什么命令,再决定是否批准。
2. Mac mini 变成常驻工程助理。很多技术人家里或办公室都有一台常开的小主机。Codex 跑在上面,手机端负责调度,它就像一个远程工程工作台。你在外面想到一个功能、发现一个问题、需要查一段日志,都可以把任务丢过去。
3. 桌面软件也能进入自动化链路。不是所有事情都能靠命令行完成。有些任务必须打开 GUI 软件,点按钮,填表单,导出文件。Computer Use 的价值就在这里:当 CLI、MCP、浏览器自动化都不够用时,它可以直接理解屏幕并操作应用。
4. 一个人维护多个项目时,工作流会更轻。独立开发者、站长、小团队经常同时维护博客、导航站、脚本、监控、服务器和内容更新。手机端 Codex 让这些碎片任务更容易被丢进一个统一队列,而不是每次都打开电脑、SSH、切目录、手动处理。
5. 代码审查和发布前检查更及时。Codex 能生成 diff,手机端能看变更并做确认。对一些小修改、样式调整、配置修复来说,这种“移动端轻审查”会让发布节奏更顺。
那 OpenClaw 就完全没用了?
我不这么看。OpenClaw 的通用遥控价值会被官方能力压缩,但它仍然可能在几个方向继续有空间。
第一,开源和自托管。有人就是不想把所有东西放进官方闭环里,想自己掌控数据、服务和部署方式。OpenClaw 这种开源项目依然有吸引力。
第二,多渠道消息入口。OpenClaw 文档里强调 WhatsApp、Telegram、Discord、邮件等渠道。ChatGPT App 很强,但它不是所有人的工作入口。有些人希望用 Telegram 发命令,有些团队已经把 Discord 当工作台,这类场景官方未必完全覆盖。
第三,多模型和可替换后端。OpenAI 的方案当然最适合 OpenAI 生态,但开源项目可以接更多模型、更多本地服务、更多自定义 Agent。这对爱折腾的人来说很重要。
第四,自定义技能和实验场。OpenClaw 如果继续往“技能市场”“本地自动化脚本”“私有工作流编排”方向走,仍然可能成为高级用户的实验平台。
第五,非开发者桌面任务。Codex 的核心气质仍然偏工程和开发。OpenClaw 如果能把普通桌面任务、办公流程、消息流、文件流做得更顺,也有机会形成差异。
安全问题会越来越重要
无论是 Codex + Computer Use,还是 OpenClaw 这类本地 Agent,只要它能操作电脑,就不能只讨论“好不好玩”。真正应该关心的是:
- 它能看到哪些屏幕内容?
- 它能访问哪些文件和目录?
- 它能不能执行 shell 命令?
- 危险命令是否必须人工审批?
- 它是否会误点、误删、误发送?
- 日志和截图会不会被保存或上传?
- 第三方插件、MCP、脚本是否可信?
AI Agent 越强,越需要权限边界。以后真正成熟的桌面 Agent,不会是“什么都能自动点”的玩具,而应该是“默认受限、关键动作审批、可审计、可回滚”的生产力系统。
我的判断
如果把 OpenClaw 理解成“手机或消息软件遥控本地 AI 电脑助手”,那 OpenAI 这次更新确实打到了它最核心的位置。ChatGPT App 负责移动端入口,Codex 负责工程执行,Computer Use 负责桌面应用,GPT-5.5 负责更强的推理和工具调用,这套组合拳一旦跑顺,对普通用户来说会非常有吸引力。
所以我会把结论说得更具体一点:对大多数想用手机控制 Codex、远程处理代码和桌面任务的人,OpenAI 官方方案会逐渐成为首选;对需要开源、自托管、多渠道、多模型和深度自定义的人,OpenClaw 仍然有存在价值。
也就是说,OpenClaw 不一定会消失,但它不能再只靠“把 AI 代理接到本地电脑上”这个概念吃饭了。官方产品已经把这条路修到了用户面前。接下来第三方项目要活得好,必须提供官方不方便做、或者不愿意做的东西:更开放的模型选择、更自由的部署方式、更强的本地工作流、更适合某类人群的定制体验。
AI Agent 的竞争,正在从“谁能演示控制电脑”进入“谁能稳定、可信、可持续地融入工作”。这才是这次更新真正值得关注的地方。