Codex 研究给企业 AI 项目一个提醒,先建任务队列

OpenAI 把 Codex 的使用数据拿出来做研究,最有用的地方不在那些好看的增长曲线。真正刺到企业软件团队的是一件很朴素的事,agent 正在从问答框变成工作队列。

报告把个人用户、组织用户和 OpenAI 内部使用分开看。里面提到,样本里的个人用户有 80.6% 至少交给 Codex 一次超过半小时人类工作量的任务,OpenAI 内部很多岗位已经把 Codex 当成主要工作入口。法律、招聘、财务这些非开发岗位也在用它处理数据、文档、自动化和排障。

别把 agent 当大号聊天框

很多企业做 AI 项目,会先做一个问答入口。能查制度,能问知识库,能总结会议,看起来挺顺。可 Codex 这类 agent 的变化在于,它能接住一个任务,然后自己翻文件、跑命令、改内容、反复试。入口还是一句话,后面已经是执行链路。

这对企业系统的影响很直接。客户提的需求会从帮我查一下,变成帮我把这批客户分类、生成跟进建议、写入 CRM 草稿、把异常项列出来。系统要接住的不是一次回答,而是一串动作。

任务队列要先于大模型方案

我更建议企业先画任务队列。谁发起任务,任务能拆成几步,哪一步可以并行,哪一步要等人工确认,失败后进哪个异常池,哪些结果能回写业务系统。这个队列画不清,模型选得再贵也容易变成演示。

一个售后 agent 可以这样拆。读工单,查设备台账,找合同范围,生成处理建议,标出缺少的资料,交给客服确认。确认以后再写回复草稿。到这里已经够用了,别急着让它自动关闭工单。

并行能力会放大管理问题

研究里有个点很容易被忽略,重度用户会同时跑多个 Codex 任务。对个人来说,这很爽。对企业来说,队列一下子多起来以后,成本、权限、审计和重复执行都会冒出来。

比如销售部门让 agent 同时跑客户画像、合同摘要、跟进邮件和商机评分。四个任务都读客户资料,谁能读哪些字段,生成内容算不算正式记录,失败了要不要重试,重试几次,费用怎么算,后端都得给答案。

复核点要做在流程里

agent 做长任务时,人工复核不能只放在结尾。等它跑完再看,很多错误已经混进结果里。更稳的做法是把复核点嵌进流程,读资料后给依据,生成草稿前给字段,回写系统前给差异。

优易云做企业流程系统时,会把这些点做成状态。待读取、待生成、待确认、待写入、已拦截、已回滚。状态看起来很土,但它能让业务负责人看懂任务跑到哪一步,也能让技术团队排查问题。

技能库要有人负责

Codex 研究提到 skill 的使用,很多重度用户会把复杂工作沉淀成可复用指令。企业里也会自然长出这类东西,比如报价检查模板、合同审阅模板、工单分类模板。问题来了,谁维护这些模板。

如果每个部门自己写一套,几个月后就会出现口径不一致。销售模板按旧价格算,财务模板按新规则拦,客服模板还在用上一版产品说明。到时候不是 agent 不行,是知识和流程没人管。

优易云的落地建议

企业准备做 agent 项目,可以先挑一个低风险但高频的流程。不要只写一个漂亮提示词。把任务状态、权限字段、复核页面、日志和回滚动作一起设计出来,再让模型进来干活。

agent 的价值不在它说得多像人。它能把一段没人愿意做的重复流程接过去,又不把系统搞乱,这才算真正上线。