ChatGPT 手机端接管 Codex：Computer Use + GPT-5.5 会让 OpenClaw 被取代吗？

如果只看标题，OpenAI 在 2026 年 5 月 14 日发布的 Codex 手机端预览，好像只是“ChatGPT App 里多了一个 Codex 入口”。但真正值得注意的不是入口本身，而是它背后的工作流变化：手机可以连接正在运行 Codex 的桌面或远程环境，查看任务、继续对话、审批命令、审查 diff，甚至切换到 GPT-5.5 这类更强的编码模型。

再把 Codex Computer Use 放进来，事情就更有意思了。Codex 不再只是命令行里改代码、跑测试的工具，它开始具备观察屏幕、点击、输入、操作桌面应用的能力。也就是说，一个完整链路正在成型：手机上的 ChatGPT 负责远程调度，桌面端 Codex 负责执行，本地 GUI 由 Computer Use 接管，底层模型由 GPT-5.5 这类强推理、强工具调用模型驱动。

这也是为什么我觉得，之前很火的“小龙虾”OpenClaw，会被 OpenAI 官方能力强烈挤压。这里先说清楚：“取代”不是说 OpenClaw 明天就没有价值，而是说它最吸引普通用户的那部分通用遥控能力，正在被官方产品直接覆盖。

公开信息能确认什么？

先把事实和判断分开。公开资料里能够确认的部分主要有几件事。

第一，Codex 已进入 ChatGPT 手机端研究预览。OpenAI 官方文章明确说明，用户可以在 ChatGPT mobile app 里使用 Codex，连接 Mac、Mac mini 或远程开发环境中正在运行的 Codex，会话可以在手机上继续跟进。

第二，手机端不只是“看进度”。官方介绍里提到，手机端可以查看线程、监控任务、发 follow-up、审查代码差异、批准命令，也可以启动新的云端任务。这意味着 Codex 的工作流从“坐在电脑前盯着终端”，变成了“人可以离开电脑，但仍然在关键节点做确认”。

第三，Codex 可以连接远程环境。官方提到可连接本地 Mac、Mac mini，也可以通过 SSH 等方式连接远程开发环境。对独立开发者来说，这一点很关键，因为很多人本来就有一台远程机器、家里的 Mac mini 或常驻在线的开发环境。

第四，Computer Use 让 Codex 能操作 GUI。OpenAI 的 Codex 文档把 Computer Use 描述为一个用于操作不方便通过 MCP、CLI 或浏览器自动化完成的应用的插件。在 macOS 场景下，它可以观察屏幕状态、点击、输入，并和图形界面交互。

第五，GPT-5.5 给这套链路补上了模型能力。OpenAI 在 GPT-5.5 发布文章里强调了它在复杂多步骤任务、工具使用、编码和长程工作上的提升。对 Agent 来说，模型越能稳住长链路，桌面操控和远程执行才越像真正的生产力，而不是一次性的炫技。

OpenClaw 之前为什么会火？

OpenClaw 的吸引力，在于它把“本地电脑上的 AI Agent”包装成一个更容易远程触发、更容易接入日常消息渠道的系统。它的公开文档强调开源、本地优先、Computer Use、多渠道消息接入、MCP、技能、权限系统和本地记忆。这些东西组合在一起，本质上是在回答一个问题：我能不能不坐在电脑前，也让 AI 去操作我的电脑、处理我的任务？

这个方向当然有吸引力。很多人的真实需求不是“再多一个聊天框”，而是“我在手机上发一句话，电脑那边自动打开软件、整理文件、跑脚本、查资料、发消息、执行某个流程”。OpenClaw 这样的项目刚好踩中了这个点，所以它会被讨论、被转发、被拿来折腾。

但问题也在这里：当 OpenAI 官方把 ChatGPT App、Codex、GPT-5.5、Computer Use 和远程连接串起来以后，OpenClaw 的核心卖点会受到正面冲击。

为什么官方链路会压缩 OpenClaw 的空间？

第一，入口被官方拿走了。OpenClaw 最大的价值之一，是把手机或聊天软件变成桌面 Agent 的入口。现在 ChatGPT App 自己就能连接 Codex，会话、审批、diff、任务状态都在官方应用里闭环。对普通用户来说，少装一个第三方入口、少配一套中间层，就是巨大的优势。

第二，执行层被 Codex 接住了。OpenClaw 如果要成为“能干活的电脑 Agent”，需要自己处理任务执行、工具调用、权限边界、GUI 自动化、上下文保持等问题。而 Codex 本来就是 OpenAI 面向开发者和工程任务打造的执行层，它能读代码、改文件、跑命令、处理 diff，再加上 Computer Use 后，覆盖面会明显扩大。

第三，模型能力被 GPT-5.5 拉高了下限。桌面自动化不是简单的点击脚本，它需要理解目标、拆任务、遇到异常能恢复、知道什么时候要问人。GPT-5.5 这类模型越强，第三方项目靠“接入多个模型 + 外壳编排”形成的差异就越难维持。除非第三方项目在流程、生态、隐私或部署方式上有独特价值，否则很容易被官方能力追上。

第四，信任和安全会天然偏向官方产品。能操作桌面的工具，本质上很敏感。它可能看到屏幕内容，可能点击按钮，可能执行命令，可能接触文件和凭据。普通用户在这类场景里会更倾向于选择权限边界、产品体验、更新维护和安全说明更完整的官方方案。

第五，维护成本不在一个量级。Computer Use、Codex、ChatGPT App、模型更新、远程连接、审批体验，这些东西都需要长期迭代。开源项目可以很灵活，但要持续追赶官方产品的完整体验，难度会越来越大。

真正变化的是工作流

过去我们使用 AI 编程工具，大多是这样的：

人坐在电脑前 -> 打开 IDE 或终端 -> 调用 AI -> 等它修改 -> 人检查结果

而这次 OpenAI 给出的方向更像这样：

手机发起或跟进任务 -> 远程 Codex 执行 -> 必要时申请人类审批 -> 桌面应用由 Computer Use 操作 -> 人在手机上审查结果

这一步很重要。AI Agent 的价值不只是“模型回答更聪明”，而是它能不能嵌进人的真实工作流。手机端让人不必一直守在电脑前，远程环境让任务可以持续运行，审批机制让高风险操作不会完全脱离人的控制，Computer Use 则补上了“很多软件没有 API、没有 CLI、不能只靠网页自动化”的缺口。

几个很现实的使用场景

1. 出门在外审批 Codex 命令。比如你让 Codex 在远程机器上修一个网站 bug，它需要安装依赖、跑测试、修改文件。以前你可能要远程桌面或等回到电脑前，现在可以在手机上看它要执行什么命令，再决定是否批准。

2. Mac mini 变成常驻工程助理。很多技术人家里或办公室都有一台常开的小主机。Codex 跑在上面，手机端负责调度，它就像一个远程工程工作台。你在外面想到一个功能、发现一个问题、需要查一段日志，都可以把任务丢过去。

3. 桌面软件也能进入自动化链路。不是所有事情都能靠命令行完成。有些任务必须打开 GUI 软件，点按钮，填表单，导出文件。Computer Use 的价值就在这里：当 CLI、MCP、浏览器自动化都不够用时，它可以直接理解屏幕并操作应用。

4. 一个人维护多个项目时，工作流会更轻。独立开发者、站长、小团队经常同时维护博客、导航站、脚本、监控、服务器和内容更新。手机端 Codex 让这些碎片任务更容易被丢进一个统一队列，而不是每次都打开电脑、SSH、切目录、手动处理。

5. 代码审查和发布前检查更及时。Codex 能生成 diff，手机端能看变更并做确认。对一些小修改、样式调整、配置修复来说，这种“移动端轻审查”会让发布节奏更顺。

那 OpenClaw 就完全没用了？

我不这么看。OpenClaw 的通用遥控价值会被官方能力压缩，但它仍然可能在几个方向继续有空间。

第一，开源和自托管。有人就是不想把所有东西放进官方闭环里，想自己掌控数据、服务和部署方式。OpenClaw 这种开源项目依然有吸引力。

第二，多渠道消息入口。OpenClaw 文档里强调 WhatsApp、Telegram、Discord、邮件等渠道。ChatGPT App 很强，但它不是所有人的工作入口。有些人希望用 Telegram 发命令，有些团队已经把 Discord 当工作台，这类场景官方未必完全覆盖。

第三，多模型和可替换后端。OpenAI 的方案当然最适合 OpenAI 生态，但开源项目可以接更多模型、更多本地服务、更多自定义 Agent。这对爱折腾的人来说很重要。

第四，自定义技能和实验场。OpenClaw 如果继续往“技能市场”“本地自动化脚本”“私有工作流编排”方向走，仍然可能成为高级用户的实验平台。

第五，非开发者桌面任务。Codex 的核心气质仍然偏工程和开发。OpenClaw 如果能把普通桌面任务、办公流程、消息流、文件流做得更顺，也有机会形成差异。

安全问题会越来越重要

无论是 Codex + Computer Use，还是 OpenClaw 这类本地 Agent，只要它能操作电脑，就不能只讨论“好不好玩”。真正应该关心的是：

它能看到哪些屏幕内容？
它能访问哪些文件和目录？
它能不能执行 shell 命令？
危险命令是否必须人工审批？
它是否会误点、误删、误发送？
日志和截图会不会被保存或上传？
第三方插件、MCP、脚本是否可信？

AI Agent 越强，越需要权限边界。以后真正成熟的桌面 Agent，不会是“什么都能自动点”的玩具，而应该是“默认受限、关键动作审批、可审计、可回滚”的生产力系统。

我的判断

如果把 OpenClaw 理解成“手机或消息软件遥控本地 AI 电脑助手”，那 OpenAI 这次更新确实打到了它最核心的位置。ChatGPT App 负责移动端入口，Codex 负责工程执行，Computer Use 负责桌面应用，GPT-5.5 负责更强的推理和工具调用，这套组合拳一旦跑顺，对普通用户来说会非常有吸引力。

所以我会把结论说得更具体一点：对大多数想用手机控制 Codex、远程处理代码和桌面任务的人，OpenAI 官方方案会逐渐成为首选；对需要开源、自托管、多渠道、多模型和深度自定义的人，OpenClaw 仍然有存在价值。

也就是说，OpenClaw 不一定会消失，但它不能再只靠“把 AI 代理接到本地电脑上”这个概念吃饭了。官方产品已经把这条路修到了用户面前。接下来第三方项目要活得好，必须提供官方不方便做、或者不愿意做的东西：更开放的模型选择、更自由的部署方式、更强的本地工作流、更适合某类人群的定制体验。

AI Agent 的竞争，正在从“谁能演示控制电脑”进入“谁能稳定、可信、可持续地融入工作”。这才是这次更新真正值得关注的地方。