这是一篇结构化的 Codex 入门教程——从安装登录、界面认识、AGENTS.md 设置,到 Skills/插件、实战做网页和 App,覆盖新手最常踩的坑。开课前抽时间读完,对课堂内容会更有理解。
很多人第一次接触 Codex,会下意识把它理解成"更会写代码的 ChatGPT"——这个理解太窄了。
更准确的说法是:Codex 是一个围绕项目、文件、命令和任务持续推进的 AI Agent。普通聊天工具的核心是"回答你一句话"。Codex 的核心是把一件事往前做:读文件、理解项目、列计划、改内容、跑命令、看结果、总结 diff,必要时等你批准下一步。
"打开 → 给 prompt → 拿一段答案 → 关掉"——每次对话结束,上下文就死了一次。下一次又要重新解释、重新建立。
一个任务可以连续推进几天甚至几周;你离开电脑后它仍能继续跑;它可以定时回来检查;在关键节点把你叫回来判断。
把 Codex 用到极致的核心:不是让它多回答几句,而是给工作建立一个 operating loop(持续运转的小循环)。你不再是每一步都亲手操作的人,而是目标设定者、边界设定者、判断者和验收者。
前提两个:能科学上网 + 有一个 ChatGPT 账号。这两个用户自己解决,下面只讲 Codex 本身的安装。
chatgpt.com/zh-Hans-CN/codex/get-started/。Mac 和 Windows 都有版本(Linux 用户走 CLI 命令行)。下载安装包,正常拖拽安装。| 套餐 | 价格 | 适合 |
|---|---|---|
| 免费 | $ 0 | 下载体验,几乎用两下就没了,不推荐 |
| Plus | $ 20/月(约 150 元) | 新手入门必备,日常使用够用 |
| Pro | $ 200/月 | 跑自动化、控浏览器、写工具的重度用户必选 |
EMBA 老板上课前开 Plus 就行(够你完成所有课堂练习)。课后如果真要把 5 大系统跑通,可以再考虑升 Pro。
界面看着复杂,其实只有 3 个区域。理解了这 3 个区域 + 几个关键设置,你就抓住了 Codex 的全部。
跟 ChatGPT 一样的聊天界面。你和 Codex 真正交流的地方,输入需求、上传文件、看 AI 干活进度。
管理所有项目和对话。对话适合临时任务(调研、规划),项目才是 Codex 的主战场。
选模型(GPT-5.5)、推理等级(高/超高)、运行模式(标准/快速)、权限(默认/自动审查/完全访问)。
Codex 干完活后的产出在这里——文件 diff、浏览器预览、代码变化、终端输出,全部可视化。
对话(Chat)适合不需要绑定文件夹的零碎任务:做调研、问问题、做规划。文件不会保存到本地。
项目(Project)是 Codex 真正的主战场。选一个本地文件夹作为项目目录,Codex 就以这个文件夹为工作区间,所有生成的文件自动存进去。
一个项目放一个大方向,一个对话只做一件具体事。不要上午让它改网页、下午让它算账、晚上让它写文章还都塞在同一条对话里。上下文越乱,AI 越容易误解你的目标。
| 权限模式 | 说明 | 建议 |
|---|---|---|
| 默认权限 | 动个啥都要问你审批 | 新手起步阶段 |
| 自动审查 | AI 自己审,有风险才弹窗 | 日常推荐(性价比最高) |
| 完全访问 | 全部自动放行,不打扰你 | 熟练后,做演示项目时用 |
GPT-5.5(目前最强)高 就够,硬活大活再开 超高快速是 1.5× 速度但烧 2× tokens——除非额度无限,否则选 标准点左下角"设置 → 剩余额度",能看到 5 小时内还剩多少、本周还剩多少、什么时候刷新。Codex 是按 5 小时和 1 周双重限制。
这一步不!能!跳!新手最容易掉进的坑就是装好就开干,结果体验拉胯。先把这几个开关打开,效率立刻翻倍。
AGENTS.md 是从上往下分层穿透的约束体系——这是 Codex 最强大但最容易被忽视的功能之一。
下面是 OpenAI 大神 Karpathy 公开的 AGENTS.md 模板,直接复制粘贴到 Codex 全局设置里就行。这个模板能让 AI 少犯一半的"过度发挥"错误。
# Behavioral guidelines to reduce common LLM coding mistakes. # Merge with project-specific instructions as needed. **Tradeoff:** These guidelines bias toward caution over speed. For trivial tasks, use judgment. ## 1. Think Before Coding **Don't assume. Don't hide confusion. Surface tradeoffs.** Before implementing: - State your assumptions explicitly. If uncertain, ask. - If multiple interpretations exist, present them - don't pick silently. - If a simpler approach exists, say so. Push back when warranted. - If something is unclear, stop. Name what's confusing. Ask. ## 2. Simplicity First **Minimum code that solves the problem. Nothing speculative.** - No features beyond what was asked. - No abstractions for single-use code. - No "flexibility" or "configurability" that wasn't requested. - No error handling for impossible scenarios. - If you write 200 lines and it could be 50, rewrite it. Ask yourself: "Would a senior engineer say this is overcomplicated?" If yes, simplify. ## 3. Surgical Changes **Touch only what you must. Clean up only your own mess.** When editing existing code: - Don't "improve" adjacent code, comments, or formatting. - Don't refactor things that aren't broken. - Match existing style, even if you'd do it differently. - If you notice unrelated dead code, mention it - don't delete it. When your changes create orphans: - Remove imports/variables/functions that YOUR changes made unused. - Don't remove pre-existing dead code unless asked. The test: Every changed line should trace directly to the user's request. ## 4. Goal-Driven Execution **Define success criteria. Loop until verified.** Transform tasks into verifiable goals: - "Add validation" → "Write tests for invalid inputs, then make them pass" - "Fix the bug" → "Write a test that reproduces it, then make it pass" - "Refactor X" → "Ensure tests pass before and after" For multi-step tasks, state a brief plan: 1. [Step] → verify: [check] 2. [Step] → verify: [check] 3. [Step] → verify: [check] Strong success criteria let you loop independently. Weak criteria ("make it work") require constant clarification. # These guidelines are working if: # - fewer unnecessary changes in diffs # - fewer rewrites due to overcomplication # - clarifying questions come before implementation rather than after mistakes
在"外观 → 宠物"里可以选一只桌面像素宠物。它会实时反映 Codex 工作状态——任务跑起来时它会动,跑完了它会安静。不用盯屏幕也能知道进度。
技能和插件是 Codex 真正的"杀手锏"。它们让 AI 不再是通才,而是能针对特定任务调用专家级能力。
给 Agent 的"技能包"。装上之后,AI 遇到相关任务自动按这套方法干活,不用每次重新写一大堆提示词。按需加载,不浪费上下文。
一组技能 + 工具 + 配置打包的"安装包"。比技能更成熟。Codex 自带可视化 UI 管理界面,比命令行友好很多。
| 名称 | 作用 | 适合 |
|---|---|---|
| awesome-codex-skills | Skill 合集(开发/生产力/写作/数据/工具五大类) | 所有人(优先装) |
| keep-codex-fast | 保持 Codex 运行速度,不会越用越慢、不丢数据 | 所有人(必装) |
| Image Gen | 内置图像生成(GPT-Image-2) | 需要做图的 |
| Computer Use | 让 Codex 直接操作你的电脑 | 跨应用自动化 |
| Chrome 扩展 | 沿用已登录的 Chrome 账号操控浏览器 | 抓数据、批量操作后台 |
直接把 Skill 的 GitHub 链接发给 Codex,让它自动安装。或者用内置的 $skill-installer。安装第三方 Skill 前注意安全——优先选社区高星的。
/:调用斜杠命令(如 /状态、/压缩、/宠物)$:直接调用技能(如 $image-gen、$skill-creator)@:点名插件(如 @浏览器、@电脑、@Chrome)最经典的"有手就行"案例。跟着做一遍,你就理解了 Codex 的完整工作流。
my-website),在 Codex 左侧"项目"里点 + 添加这个文件夹。本地做出来的网页只有你看得到。想发给别人?最简单的方式是用 Netlify 插件:在 Codex 里 @Netlify 一句话部署,自动给你一个可访问的链接。
网页是入门款,App 是真正的"哇时刻"。下面用一个真实需求演示——用药提醒 App。
"医生开了 3 种药,一天 2-3 次,有的饭前 30 分钟、有的饭后吃,我经常搞混。能不能做一个手机 App 自动提醒?" 这就是一个完美的小型需求。
@电脑 帮我下载并安装 Xcode——Computer Use 会自动操作你的电脑去搜索、下载、安装。Computer Use 目前只支持 macOS,而且很烧 tokens。一个跨应用的任务可能消耗 8 万 tokens。能用浏览器或终端完成的事,不要用 Computer Use。
这一步是把 Codex 从"工具"变成"操作系统"的关键。掌握后,你的工作效率会再上一个数量级。
不要把所有任务当成临时聊天。重要工作应该有长期线程:一个线程负责某代码库,一个负责日报,一个负责客户项目。长期线程的价值是保留推理轨迹。
AGENTS.md(硬规则)+ Vault(项目状态笔记,建议放 Git)+ Memories(个人偏好)+ Chronicle(屏幕上下文)。四层分工清晰,互不污染。
本地网页用 Browser,需要登录的网站用 Chrome 扩展,桌面 App 用 Computer Use。真正的闭环不是 Codex 说"完成了",而是你和它一起看到真实结果。
接入 GitHub、Slack、Gmail、Google Drive、Calendar、Figma、数据库。Codex 负责推理,MCP 把真实世界接进来。但工具不是越多越好——只接必要的。
如果你第三次对 Codex 解释同一套流程,就该写成 Skill。个人靠 prompt,长期靠 Skills,团队更靠 Skills——它把经验变成组织资产,而不是留在某个人的聊天习惯里。
每天总结、每小时巡检、每 15 分钟看部署、每周生成风险报告。Skill 定义方法,Automation 定义节奏。但要先手动测试 prompt,再排期运行。
必须单独说一下:Mac 用户目前是 Codex 里的 VIP,Windows 用户只是站票。如果你打算认真用 Codex,强烈建议配一台 Mac。
| 功能 | Mac | Windows | 说明 |
|---|---|---|---|
| 核心 Codex 能力 | ✓ | ✓ | 编程、文件操作、Skills、插件全都支持 |
| Computer Use | ✓ | ✗ | 让 AI 操作你的电脑——视觉级桌面自动化 |
| 远程手机控制 | ✓ | ✗ | 手机 ChatGPT App 远程控制 Mac 上的 Codex |
| Appshots | ✓ | ✗ | 双击 ⌘ 把当前窗口的截图 + 文字一起发给 Codex |
| Locked Computer Use | ✓ | ✗ | 锁屏后 Codex 还能继续操控你的 Mac |
| Chronicle | ✓ | ✗ | 屏幕上下文记忆——后台观察你的屏幕并自动记下来 |
如果你正在为公司选电脑,或者考虑换电脑——强烈推荐 Mac。Codex 的最强能力(Computer Use、远程、Appshots、Chronicle)都是 Mac 专属。Windows 版本能用,但只能用到 60% 的能力。这就是为什么很多 AI 编程团队全员配 Mac。
如果你不知道怎么开始,照这个节奏练一周——到 7 月 1 日开课时,你已经是熟练用户。
你不需要第一天就懂所有命令,也不需要马上做大项目。你只需要先完成一次小闭环:给目标 → 让它先计划 → 允许它小步执行 → 看 diff → 跑检查 → 确认结果。做到这一步,你就已经在真正用 Codex 了。
Codex 最值得老板学习的地方,不是"它会写代码",而是它把很多过去只有程序员能完成的工作,变成了可以被描述、被计划、被执行、被检查的流程。
从今天起,你的工作模式应该这样:
你不再是每一步都亲手操作的人。你是目标设定者、边界设定者、判断者和验收者。
一句话总结整篇教程:
读完这篇教程,你已经知道 Codex 能做什么、怎么做。但看 100 遍不如自己跑一次。7 月 1 日,丰年老师带你在现场亲手跑通一切——从安装到 5 大老板系统,从提示词到 Computer Use。