AI CEO 编程课 · 课前预习站
课 前 预 习 · 入 门 到 精 通

Hermes Agent
从聊天 AI 到长期工作系统

如果你最近接触 Agent,很容易有一种疲惫感:工具太多、看着都像"又一个会聊天的 AI"、真上手又发现它跑偏。Hermes 不是因为它有多"神",而是因为它更接近一个能长期跑的工作系统。这本手册不追求神话 Hermes,目标只有一个——让它今天就能上手、下周就能复用、一个月后还能继续扩展。

40–80 分钟阅读 📦 5 大 Part · 18 章 🛠 6 个可复制模板 🎯 5 个实战工作流
/ 目 录 · 18 章 + 附录
PART 1 · P A R T   O N E

先把 Hermes 讲明白

Hermes 不是一个普通聊天框,是一套带工具、有记忆、可调度的 AI 后台。在动手装之前,先把这三件事弄清楚——为什么学、它和别的工具什么关系、整套系统怎么转。

01 · 为什么现在值得学 Hermes

这一节解决什么问题

很多人已经会用 ChatGPT、Claude、Kimi 这类聊天 AI,但一进真实工作就会碰到两个现实问题:

这一节的任务,是把 Hermes 放进一个更准确的位置:它不是单纯的聊天入口,而更像一个可长期运行的 AI 后台

先看一个真实场景

你是运营、项目经理,每天早上想收到一份 10 分钟能看完的行业简报:昨天最重要的 5 条信息、和你业务有关的竞品动态、今天你最该注意的 1 条风险。你不想每天重复搜网页、复制链接、拼摘要。你想要的是:它每天固定时间自动跑、把结果发到 Telegram 或 Slack、没变化时别打扰你。

这类需求本质上不是"聊天",而是"长期后台任务"。Hermes 的 Cron 定时任务 和 Messaging Gateway(消息网关)就是为这种场景准备的

原理讲解 · Hermes 的核心价值来自 5 件事

截至本手册编写时(v0.8.0),Hermes 具备 Tools / Memory / Skills / Delegation / Cron / MCP / API Server 等能力。

⚠ 避 坑 提 醒
  • 不要把"越用越强"理解成必然——它会沉淀,但前提是你给它稳定目标、稳定反馈、稳定输出格式。
  • 不要第一天就把终端、文件改写、外部系统写入权限全开。
  • 不要把"后台自动化"理解成"可以永远不看"。真正稳的方式,是把关键节点留给人工复核。

02 · 从 Harness Engineering 到 Hermes

这一节解决什么问题

很多人"会聊 AI",但做不好"工作 AI"。问题通常不是模型不够强,而是环境不稳定、规则不连续、工具边界不清楚。这一节讲清楚为什么同一个模型放在不同工作环境里,表现差这么多。

真实场景

你让 AI 帮你改一份方案:今天它写得很清楚;明天同样的需求,它又开始空话连篇;后天你让它照着你们团队规范写,它又忘了目录、忘了语气、忘了不能碰的边界。这不是它忽然变笨,而是你每次都在重新"搭现场"。

原理讲解 · 把 Harness Engineering 理解成一句话

不是只给 AI 一个问题,而是给 AI 一整套"做事环境"。

这套环境至少包含 5 层:

解决什么在 Hermes 里落到哪
指令层它该怎么做事AGENTS.md / SOUL.md / Skill
记忆层它该长期记什么MEMORY.md / USER.md
工具层它能动用哪些手段Tools / Toolsets / MCP
调度层它什么时候做Cron / Gateway
反馈层它怎么越做越稳你的复盘 · 技能更新 · 规则更新

Hermes 的优势,不在于"单次回答更花哨",而在于它天生把这些层都拆出来了——Context Files 承担项目规约,Persistent Memory 承担长期偏好和环境事实,Skills 承担重复方法,Toolsets 和 MCP 承担执行手段,Cron 承担时间维度。

⚠ 避 坑 提 醒
  • 不要一上来写几十条规矩,规则太多最后谁也记不住。
  • 不要把"人格设定"和"项目规则"混在一起。SOUL.md 更偏语气,AGENTS.md 更偏做事边界。
  • 不要把敏感信息写进长期记忆。

03 · Hermes 全景 · 60 秒看懂

把 Hermes 记成下面这条链就够了

Plain Text 你 Gateway / API Server

Context Files / Memory / Skills / Tools / MCP / Delegation / Cron

输出到本地 / IM / 前端或外部系统

一句话理解每个模块

模块你可以把它当成最常用来解决什么
Context Files项目规章制度统一规则、避免跑偏
Memory长期偏好与环境事实让它越来越像你的工作搭子
Skills可复用方法说明书周报、调研、审稿、复盘
Tools手脚搜索、执行、改文件、抓网页
MCP外接工具适配层挂 GitHub、数据库、内部系统
Cron闹钟和后台任务队列日报、周报、监控、提醒
Delegation并行外包同时走三路资料或并行排障
API Server统一后端接 Open WebUI、LobeChat 等前端

Hermes 和别的工具的区别

工具更像什么什么时候更合适
Claude Code终端里的结对编程助手你人在回路里,边聊边改代码
OpenClaw配置驱动的 Agent 框架你想把人格、规则、边界显式写进 SOUL.md 等配置
Hermes Agent可长期运行的 AI 后台你需要记忆、技能、定时任务、消息入口和后台流程

这里不需要把三者变成"谁赢谁输"的排名。更实用的理解是:

⚠️
PART 1 核心提醒

不要把 Hermes 当成"万能聊天框",要把它当成"有记忆、有规则、有工具、有调度的工作系统"。如果这个定位一开始就错了,后面几乎每一章都会读歪。

PART 2 · P A R T   T W O

核心机制 · 但全部讲人话

学习循环、记忆系统、Skills、Tools/MCP——这 4 个机制是 Hermes 的发动机。不掌握它们,你只是在用一个更花哨的聊天框。

04 · 学习循环怎么工作

你不缺一个"能回答问题的 AI",你缺的是一个"做完之后能沉淀、下次更省力"的工作方式。这一节要讲的是:怎么把一次性的输出,变成后面持续可复用的能力。

原理讲解 · 4 步学习循环

STEP 01
固定输入

每次给的素材类型一致(如:同一来源、同一格式、同一长度)。输入稳,输出才稳。

STEP 02
固定输出

明确输出格式(标题/段落/字段/长度),不让它自由发挥。

STEP 03
固定反馈

一次给 1-3 条反馈,不要十几条一起怼上去。少而准比多而散更有效。

STEP 04
固定沉淀位置

偏好进 USER.md,环境事实进 MEMORY.md,项目规则进 AGENTS.md,重复任务方法进 Skill。

这意味着:Hermes 的真正"进步"不该依赖模糊的"它自己变聪明",而应依赖你把经验沉淀进长期有效的载体。

⚠ 避 坑 提 醒
  • 不要一次给十几条反馈。
  • 不要把短期细节写进长期记忆。
  • 不要让一个 Skill 变成"万能大杂烩"——最好只解决一类任务。

05 · 记忆系统怎么用

"记忆"是让 AI 从一次性工具变成长期助手的关键,但它也是最容易被误用的部分。

真实场景

你希望 Hermes 长期记住:你偏好的写作语气、你常用的工具和工作环境、你们团队固定的交付标准。

但你又不希望它记住:一次性的抱怨、敏感密钥、与长期工作无关的细碎临时信息。

原理讲解 · 内置记忆拆成两份

文件更适合放什么官方位置
MEMORY.md环境事实、长期约定、经验性记录~/.hermes/memories/
USER.md用户偏好、沟通风格、输出习惯~/.hermes/memories/

它们的特点不是"",而是"短、准、会在会话开始时注入系统提示词"。

如果你需要更深的跨会话知识,可以启用 external memory providers,但请注意:内置记忆一直都在;外部 provider 是"增强层",不是默认必须开启的东西。

⚠ 避 坑 提 醒
  • 不要把 MEMORY.md 当知识库。它更像一张长期偏好与约束清单。
  • 不要把密钥、客户隐私、内部敏感信息写进去。
  • 开外部 provider 前,先问自己:你是真的需要更深记忆,还是只是还没把内置记忆写清楚。

06 · Skills · 为什么是 Hermes 的护城河

你不缺提示词,你缺的是能反复复用的方法。Skill 不等于"把所有提示词塞进去",而是一份按需加载的知识文档。

真实场景

你每周都要写周报,希望做到:输入固定、输出结构固定、材料不够时明确指出缺什么、以后可以一键复用。这就是一个典型 Skill 的场景。

三者分工讲清楚,会少走很多弯路

你要沉淀的东西更适合放哪里
你的全局偏好USER.md
项目级规则和边界AGENTS.md
一类任务的工作方法Skill

官方文档说明:Skills 是按需加载的知识文档,兼容 agentskills.io,统一存放在 ~/.hermes/skills/

⚠ 避 坑 提 醒
  • Skill 不等于"把所有提示词塞进去"。
  • 不写输入要求,最后得到的质量会非常随机。
  • 不写禁止事项,它就更容易"脑补"空白。

07 · Tools、MCP 与 Context Files

初次使用时最容易犯的错之一,就是一上来追求"全自动",结果给了太多工具,最后完全不可控。

原理讲解 · 把三者理解成

CONTEXT FILES
决定"应该怎么做"

项目规则、边界、必须遵守的标准。Context Files 是"让强能力不失控"的关键。

TOOLS
决定"能做什么"

Hermes 的 Tools 覆盖了 web / terminal / file / browser / skills 等类别。

MCP
决定"还能再接什么"

~/.hermes/config.yaml 中通过 mcp_servers 接入外部能力。

⚠ 避 坑 提 醒
  • MCP 不是越多越好。内置工具够用时,先别引入额外复杂度。
  • 不要把 GitHub Token 之类的密钥写进公开文档。
  • Context Files 里最好明确写"哪些工具允许使用""哪些动作必须先确认"。
⚠️
PART 2 核心提醒

记忆不是杂物箱,Skill 不是万能提示词,MCP 也不是"多多益善"。把每类信息放到正确位置,Hermes 才会越用越稳。

PART 3 · P A R T   T H R E E

从零搭起来 · 第一次就搭对

技术细节这部分建议交给团队技术人员完成,老板只需了解选择逻辑,无需亲自操作。但你需要懂"它跑在哪、接什么模型、怎么保证安全"这三件事的判断逻辑。

08 · 安装与部署怎么选

💡
老板视角

以下安装与部署操作涉及技术细节,建议交由团队技术人员完成。老板只需了解选择逻辑,无需亲自操作。

三件事先选对

最短路径

1
先本地跑通
先在自己 Mac/Windows(WSL2)上装好,跑一次最小对话。~/.hermes/ 是所有运行数据的集中位置。
2
再接 Telegram
让它能从手机给你发任务、收结果。这是入口能力,不是后台能力。
3
最后迁到 VPS 常驻
VPS 上 24h 运行,可以接 Cron 定时任务,真正变成"后台系统"。
⚠ 避 坑 提 醒
  • 企业环境里,不要闭着眼执行远程安装脚本。
  • 不要把 provider key、Slack token、Telegram token 写进聊天记录或截图。
  • 第一天先别碰 WhatsApp bridge、复杂浏览器自动化之类的高复杂度接入。

09 · 第一次启动 · 第一次对话

很多人第一次用 Agent,不是不会装,而是不知道:第一次该验证什么?第一次该说什么?第一次哪些边界必须先立住?

CLI 主入口三个命令

会话数据会落到 ~/.hermes/state.db~/.hermes/sessions/,便于恢复与审计。

第一次对话推荐用这个模板

模板 1 · 第一次对话
你从现在开始是我的 Hermes 工作助理。
我的身份:{岗位/行业/常用工具}
我的目标:帮我把信息变成可执行清单、短报告和固定格式输出。
我的偏好:
  1)先给结论,再给细节。
  2)任何涉及执行命令、改文件、发消息的动作,都先解释风险。
  3)不确定时先问 1 个澄清问题。
⚠ 避 坑 提 醒
  • 不要在第一天就让它"自动化一切"。
  • 不要第一次就把终端执行权限用到真实生产目录。
  • 如果后面要接 Telegram 或 Slack,第一次就把输出格式和推送偏好说清楚,后面做 Cron 会轻松很多。

10 · 多平台接入 · CLI / Telegram / Slack / Discord

真正会长期使用的 Agent,通常不会只活在一个终端窗口里。你白天在 Slack 工作,晚上手机更常用 Telegram——你希望它能同时跟你"在哪都对得上号"。

入口适合谁说明
Telegram个人移动入口手机随时一句话发指令
Slack团队协作更适合工作群里的"机器人"
Discord社区/项目组带频道结构的协作
WhatsApp风险方案它依赖 WhatsApp Web bridge,不是默认推荐
⚠ 避 坑 提 醒
  • WhatsApp 只放在风险说明里,不建议作为默认入口。
  • Telegram 群聊里收不到消息,常见原因是隐私模式没处理好。
  • Slack 如果 DM 能用、频道不回,大概率是权限、事件订阅或 /invite 没配全。

11 · 第一个 Skill 与第一个 Cron

这一节的目标很实际:不再只让 Hermes 跟你聊天,而是做出第一个真正可复用、可定时、可投递的闭环

真实场景 · 每周都要写周报

最烦的不是写,而是收集素材、整理格式、每次都重新组织语言。你希望它每天帮你做一次 1 分钟日报,周五自动汇总成周报,并发到 Telegram 或 Slack。

原理 · 闭环由两部分组成

日报 Skill 模板

模板 2 · 日报 Skill 提示骨架
请把输入材料整理成日报:
1)今天完成了什么
2)有什么风险或阻塞
3)明天最重要的 3 件事
4)需要谁支持

要求:短、具体、可执行。
⚠ 避 坑 提 醒
  • Cron 的提示词要自包含,不要写"继续上次那个任务"。
  • 不要让高风险动作在 Cron 里默默自动执行。
  • 如果你把输出投递到 Slack,要先把 home channel 和 bot 权限配好。
⚠️
PART 3 核心提醒

第一次成功,不取决于你配了多少能力,而取决于你有没有做出一个"低风险、可重复、可衡量"的闭环。先让它稳定地做一件事,再慢慢扩。

PART 4 · P A R T   F O U R

五个真正有用的工作流

前面 11 章都是为了走到这里。下面 5 个工作流是 Hermes 在真实业务里跑得最稳、最值得复制的样板。先做"只读 + 汇总 + 推送"这类价值大但风险低的自动化,不要一开始就追求能改代码、能发版、能删数据。

12 · 工作流 1 · 个人知识助手

把聊天记录升级成长期项目脑。你已经能让 Hermes 回答问题了,但一到跨度两周、三次会议、十几份材料的任务,就容易崩。

这个场景最依赖 Hermes 的三件东西

模板 3 · 长期项目开场白
我们在做一个持续 2 周的项目:【项目名】。
目标:输出【交付物】。
已确定事实:...
待验证假设:...

请每次都把新增信息合并进项目总结,
并标记"确定 / 推测 / 待验证"。
⚠ 避 坑 提 醒
  • 不要让"记忆"替代"证据"。
  • 不要把长期项目做成无边界闲聊。
  • 不要让它自动替你做最终决策。

13 · 工作流 2 · 内容创作流水线

从调研到成稿。用 AI 写内容最常见的两个极端:要么一键生成读起来像模板,要么你写 80% 它只改错别字。这节要解决的是:把内容创作拆成一条可控流水线,让 Hermes 真正承担起调研、结构、初稿、校对和风格统一。

原理 · 内容能不能像样,关键不在"模型更大",而在于流程更稳

模板 4 · 内容流水线
我要写一篇面向【读者画像】的文章,主题是【主题】。

请先给选题卡、资料卡、大纲卡,再出初稿。
不确定的内容必须标"待核验"。
最后请复盘哪些内容适合沉淀成 Skill。
⚠ 避 坑 提 醒
  • 并行调研不要超过 3 路。
  • 不要把社区观点当事实。
  • 发布前,法规、价格、产品声明类信息必须人工核验。

14 · 工作流 3 · 开发自动化 + Webhook

开发工作里最浪费时间的,往往不是写代码,而是"PR 来了谁先看 / CI 失败了谁先盯 / 发布完后谁通知"。这节要让 Hermes 在"事件发生时自动开工",但保留人工审批边界。

Webhook 自动化的核心链条

事件触发 Hermes 处理 结构化回传

官方 Webhooks 文档明确支持 GitHub / GitLab / Jira / Stripe 等事件接进 Hermes,再按你定义的规则处理。

⚠ 避 坑 提 醒
  • Webhook 必须做鉴权和签名校验。
  • 不要让它直接拿生产写权限。
  • 不要自动合并、自动发版、自动删库。

15 · 工作流 4 · 多代理并行协作

当一个任务同时包含调研、判断、写作和执行时,单代理常见两种失败:上下文太挤越做越乱、串行太慢时间全花在排队上。

原理 · Hermes 的 Delegation 支持最多 3 个并行子代理

模板 5 · 并行调研
请把这个任务拆成 3 路并行:
1)事实卡
2)对比表
3)风险与试点计划

主代理最后只做整合、去重和补洞。
⚠ 避 坑 提 醒
  • 不要让三个子代理做同一件事。
  • 不要让子代理输出长篇散文。
  • 不要让主代理把所有东西再写一遍。

16 · 工作流 5 · 团队接入与 API 化

个人能用,不等于团队能用。团队落地最常见的阻力是:入口不统一、权限不清楚、非技术同事不愿意学新工具。

团队接入两条路线

后者可接 Open WebUI、LobeChat、LibreChat 等支持 OpenAI-compatible 接口的前端。

⚠ 避 坑 提 醒
  • 不要把 Slack 机器人当成默认可信。
  • API Server 不要直接裸露公网。
  • WhatsApp 不要作为团队默认方案——它是 bridge,不是官方 Business API。
你现在最缺什么先做哪一个
信息持续追踪个人知识助手
稳定产出内容内容创作流水线
工程提醒和回传Webhook 自动化
复杂任务拆解多代理并行
团队统一入口Slack / API Server
⚠️
PART 4 核心提醒

先做"只读、汇总、提醒、结构化回传"这类价值大但风险低的自动化。不要一开始就追求能改代码、能发版、能删数据。

PART 5 · P A R T   F I V E

上线之后 · 如何保持稳定运行

Hermes 最危险的地方,不是"回答错了",而是工具真的会执行。这一部分要建立一套"默认安全"的运行方式——没有它,自动化就是事故预备役。

17 · 安全、权限与人工兜底

原理 · 安全治理三层

你要控制什么
入口层谁能跟它说话、谁能触发任务
工具层它能调用什么工具、什么动作要审批
执行层命令在哪跑、是否隔离、是否可回滚

官方配置和最佳实践里,重点指向这几件事:allowlist · terminal backend · Docker sandbox · secret 管理 · 审批边界

哪些动作必须留给人

动作类型可以自动做吗建议
资料整理、摘要、对比表可以这是最适合先自动化的部分
提醒、日报、周报初稿可以但建议保留最终确认
写评论、发群内通知可以,但要限定范围先白名单,再审批
改代码、改配置、跑迁移不建议默认自动必须审批并可回滚
发版、删数据、对外公告、付款不可以默认自动必须人工拍板
模板 6 · 安全审批
如果接下来需要执行高风险动作,请先输出:
1)将要做什么
2)风险是什么
3)回滚方式是什么
4)哪一步必须人工确认

在我明确批准前,不要执行。
⚠ 避 坑 提 醒
  • 不要因为"好用"就把权限一路放大。
  • 不要把 WhatsApp bridge 当企业级稳定接入。
  • 不要忽视输入安全:提示注入、伪造 webhook、社工式请求。

18 · 资源地图与持续学习路线

很多团队不是用不好 Hermes,而是没有路线图:第一天太兴奋什么都想试、第三天开始怀疑值不值得继续、第七天就不了了之。

学 Hermes · 抓住三条主线

主线 A
入口主线

CLI / Telegram / Slack / API Server

主线 B
治理主线

allowlist / 审批 / 隔离执行 / 密钥管理

主线 C
复用主线

Memory / Skills / Cron / Context Files

⚠ 避 坑 提 醒
  • 不要把资源地图写成链接堆砌。
  • 不要企图用一个"巨大万能 Skill"解决一切。
  • 不要把路线图做成 KPI 表演。
⚠️
PART 5 核心提醒

Hermes 不是用来替代责任人的。它适合替你跑流程、提建议、做汇总、做提醒,但高风险动作必须有人兜底

★ 附录 · 6 个最实用模板

前面章节里散布的 6 个模板汇总于此,方便你直接复制使用。每个对应一个核心场景。

模板用于位置
① 第一次对话建立工作助理身份§09
② 日报 Skill固定日报格式§11
③ 长期项目开场启动 2 周以上项目§12
④ 内容流水线拆解写作任务§13
⑤ 并行调研3 路并行子代理§15
⑥ 安全审批高风险动作前必经§17

看完这本手册,
下一步不是学完,是跑通

如果你刚看完这份手册,最好的下一步不是继续收藏更多资料,而是立刻做出一个最小闭环

/ 4 步最 小 闭 环
  1. 安装 Hermes 并完成 hermes setup
  2. 连接一个你最常用的入口 · 优先 Telegram 或 Slack
  3. 写一个最小 Skill · 优先日报或周报
  4. 创建一个每天固定时间运行的 Cron

当你真正跑通这个闭环以后,Hermes 才会从"看起来很强的 Agent"变成"真的能替你承担一部分工作的后台系统"

已复制