如果你最近接触 Agent,很容易有一种疲惫感:工具太多、看着都像"又一个会聊天的 AI"、真上手又发现它跑偏。Hermes 不是因为它有多"神",而是因为它更接近一个能长期跑的工作系统。这本手册不追求神话 Hermes,目标只有一个——让它今天就能上手、下周就能复用、一个月后还能继续扩展。
Hermes 不是一个普通聊天框,是一套带工具、有记忆、可调度的 AI 后台。在动手装之前,先把这三件事弄清楚——为什么学、它和别的工具什么关系、整套系统怎么转。
很多人已经会用 ChatGPT、Claude、Kimi 这类聊天 AI,但一进真实工作就会碰到两个现实问题:
这一节的任务,是把 Hermes 放进一个更准确的位置:它不是单纯的聊天入口,而更像一个可长期运行的 AI 后台。
你是运营、项目经理,每天早上想收到一份 10 分钟能看完的行业简报:昨天最重要的 5 条信息、和你业务有关的竞品动态、今天你最该注意的 1 条风险。你不想每天重复搜网页、复制链接、拼摘要。你想要的是:它每天固定时间自动跑、把结果发到 Telegram 或 Slack、没变化时别打扰你。
这类需求本质上不是"聊天",而是"长期后台任务"。Hermes 的 Cron 定时任务 和 Messaging Gateway(消息网关)就是为这种场景准备的。
截至本手册编写时(v0.8.0),Hermes 具备 Tools / Memory / Skills / Delegation / Cron / MCP / API Server 等能力。
很多人"会聊 AI",但做不好"工作 AI"。问题通常不是模型不够强,而是环境不稳定、规则不连续、工具边界不清楚。这一节讲清楚为什么同一个模型放在不同工作环境里,表现差这么多。
你让 AI 帮你改一份方案:今天它写得很清楚;明天同样的需求,它又开始空话连篇;后天你让它照着你们团队规范写,它又忘了目录、忘了语气、忘了不能碰的边界。这不是它忽然变笨,而是你每次都在重新"搭现场"。
不是只给 AI 一个问题,而是给 AI 一整套"做事环境"。
这套环境至少包含 5 层:
| 层 | 解决什么 | 在 Hermes 里落到哪 |
|---|---|---|
| 指令层 | 它该怎么做事 | AGENTS.md / SOUL.md / Skill |
| 记忆层 | 它该长期记什么 | MEMORY.md / USER.md |
| 工具层 | 它能动用哪些手段 | Tools / Toolsets / MCP |
| 调度层 | 它什么时候做 | Cron / Gateway |
| 反馈层 | 它怎么越做越稳 | 你的复盘 · 技能更新 · 规则更新 |
Hermes 的优势,不在于"单次回答更花哨",而在于它天生把这些层都拆出来了——Context Files 承担项目规约,Persistent Memory 承担长期偏好和环境事实,Skills 承担重复方法,Toolsets 和 MCP 承担执行手段,Cron 承担时间维度。
| 模块 | 你可以把它当成 | 最常用来解决什么 |
|---|---|---|
| Context Files | 项目规章制度 | 统一规则、避免跑偏 |
| Memory | 长期偏好与环境事实 | 让它越来越像你的工作搭子 |
| Skills | 可复用方法说明书 | 周报、调研、审稿、复盘 |
| Tools | 手脚 | 搜索、执行、改文件、抓网页 |
| MCP | 外接工具适配层 | 挂 GitHub、数据库、内部系统 |
| Cron | 闹钟和后台任务队列 | 日报、周报、监控、提醒 |
| Delegation | 并行外包 | 同时走三路资料或并行排障 |
| API Server | 统一后端 | 接 Open WebUI、LobeChat 等前端 |
| 工具 | 更像什么 | 什么时候更合适 |
|---|---|---|
| Claude Code | 终端里的结对编程助手 | 你人在回路里,边聊边改代码 |
| OpenClaw | 配置驱动的 Agent 框架 | 你想把人格、规则、边界显式写进 SOUL.md 等配置 |
| Hermes Agent | 可长期运行的 AI 后台 | 你需要记忆、技能、定时任务、消息入口和后台流程 |
这里不需要把三者变成"谁赢谁输"的排名。更实用的理解是:
不要把 Hermes 当成"万能聊天框",要把它当成"有记忆、有规则、有工具、有调度的工作系统"。如果这个定位一开始就错了,后面几乎每一章都会读歪。
学习循环、记忆系统、Skills、Tools/MCP——这 4 个机制是 Hermes 的发动机。不掌握它们,你只是在用一个更花哨的聊天框。
你不缺一个"能回答问题的 AI",你缺的是一个"做完之后能沉淀、下次更省力"的工作方式。这一节要讲的是:怎么把一次性的输出,变成后面持续可复用的能力。
每次给的素材类型一致(如:同一来源、同一格式、同一长度)。输入稳,输出才稳。
明确输出格式(标题/段落/字段/长度),不让它自由发挥。
一次给 1-3 条反馈,不要十几条一起怼上去。少而准比多而散更有效。
偏好进 USER.md,环境事实进 MEMORY.md,项目规则进 AGENTS.md,重复任务方法进 Skill。
这意味着:Hermes 的真正"进步"不该依赖模糊的"它自己变聪明",而应依赖你把经验沉淀进长期有效的载体。
"记忆"是让 AI 从一次性工具变成长期助手的关键,但它也是最容易被误用的部分。
你希望 Hermes 长期记住:你偏好的写作语气、你常用的工具和工作环境、你们团队固定的交付标准。
但你又不希望它记住:一次性的抱怨、敏感密钥、与长期工作无关的细碎临时信息。
| 文件 | 更适合放什么 | 官方位置 |
|---|---|---|
MEMORY.md | 环境事实、长期约定、经验性记录 | ~/.hermes/memories/ |
USER.md | 用户偏好、沟通风格、输出习惯 | ~/.hermes/memories/ |
它们的特点不是"大",而是"短、准、会在会话开始时注入系统提示词"。
如果你需要更深的跨会话知识,可以启用 external memory providers,但请注意:内置记忆一直都在;外部 provider 是"增强层",不是默认必须开启的东西。
你不缺提示词,你缺的是能反复复用的方法。Skill 不等于"把所有提示词塞进去",而是一份按需加载的知识文档。
你每周都要写周报,希望做到:输入固定、输出结构固定、材料不够时明确指出缺什么、以后可以一键复用。这就是一个典型 Skill 的场景。
| 你要沉淀的东西 | 更适合放哪里 |
|---|---|
| 你的全局偏好 | USER.md |
| 项目级规则和边界 | AGENTS.md |
| 一类任务的工作方法 | Skill |
官方文档说明:Skills 是按需加载的知识文档,兼容 agentskills.io,统一存放在 ~/.hermes/skills/。
初次使用时最容易犯的错之一,就是一上来追求"全自动",结果给了太多工具,最后完全不可控。
项目规则、边界、必须遵守的标准。Context Files 是"让强能力不失控"的关键。
Hermes 的 Tools 覆盖了 web / terminal / file / browser / skills 等类别。
在 ~/.hermes/config.yaml 中通过 mcp_servers 接入外部能力。
记忆不是杂物箱,Skill 不是万能提示词,MCP 也不是"多多益善"。把每类信息放到正确位置,Hermes 才会越用越稳。
技术细节这部分建议交给团队技术人员完成,老板只需了解选择逻辑,无需亲自操作。但你需要懂"它跑在哪、接什么模型、怎么保证安全"这三件事的判断逻辑。
以下安装与部署操作涉及技术细节,建议交由团队技术人员完成。老板只需了解选择逻辑,无需亲自操作。
~/.hermes/ 是所有运行数据的集中位置。很多人第一次用 Agent,不是不会装,而是不知道:第一次该验证什么?第一次该说什么?第一次哪些边界必须先立住?
hermes · 开启交互会话hermes chat -q "..." · 做一次性提问hermes --continue · 恢复最近会话会话数据会落到 ~/.hermes/state.db 和 ~/.hermes/sessions/,便于恢复与审计。
你从现在开始是我的 Hermes 工作助理。
我的身份:{岗位/行业/常用工具}
我的目标:帮我把信息变成可执行清单、短报告和固定格式输出。
我的偏好:
1)先给结论,再给细节。
2)任何涉及执行命令、改文件、发消息的动作,都先解释风险。
3)不确定时先问 1 个澄清问题。
真正会长期使用的 Agent,通常不会只活在一个终端窗口里。你白天在 Slack 工作,晚上手机更常用 Telegram——你希望它能同时跟你"在哪都对得上号"。
| 入口 | 适合谁 | 说明 |
|---|---|---|
| Telegram | 个人移动入口 | 手机随时一句话发指令 |
| Slack | 团队协作 | 更适合工作群里的"机器人" |
| Discord | 社区/项目组 | 带频道结构的协作 |
| 风险方案 | 它依赖 WhatsApp Web bridge,不是默认推荐 |
/invite 没配全。这一节的目标很实际:不再只让 Hermes 跟你聊天,而是做出第一个真正可复用、可定时、可投递的闭环。
最烦的不是写,而是收集素材、整理格式、每次都重新组织语言。你希望它每天帮你做一次 1 分钟日报,周五自动汇总成周报,并发到 Telegram 或 Slack。
请把输入材料整理成日报: 1)今天完成了什么 2)有什么风险或阻塞 3)明天最重要的 3 件事 4)需要谁支持 要求:短、具体、可执行。
第一次成功,不取决于你配了多少能力,而取决于你有没有做出一个"低风险、可重复、可衡量"的闭环。先让它稳定地做一件事,再慢慢扩。
前面 11 章都是为了走到这里。下面 5 个工作流是 Hermes 在真实业务里跑得最稳、最值得复制的样板。先做"只读 + 汇总 + 推送"这类价值大但风险低的自动化,不要一开始就追求能改代码、能发版、能删数据。
把聊天记录升级成长期项目脑。你已经能让 Hermes 回答问题了,但一到跨度两周、三次会议、十几份材料的任务,就容易崩。
我们在做一个持续 2 周的项目:【项目名】。 目标:输出【交付物】。 已确定事实:... 待验证假设:... 请每次都把新增信息合并进项目总结, 并标记"确定 / 推测 / 待验证"。
从调研到成稿。用 AI 写内容最常见的两个极端:要么一键生成读起来像模板,要么你写 80% 它只改错别字。这节要解决的是:把内容创作拆成一条可控流水线,让 Hermes 真正承担起调研、结构、初稿、校对和风格统一。
我要写一篇面向【读者画像】的文章,主题是【主题】。 请先给选题卡、资料卡、大纲卡,再出初稿。 不确定的内容必须标"待核验"。 最后请复盘哪些内容适合沉淀成 Skill。
开发工作里最浪费时间的,往往不是写代码,而是"PR 来了谁先看 / CI 失败了谁先盯 / 发布完后谁通知"。这节要让 Hermes 在"事件发生时自动开工",但保留人工审批边界。
官方 Webhooks 文档明确支持 GitHub / GitLab / Jira / Stripe 等事件接进 Hermes,再按你定义的规则处理。
当一个任务同时包含调研、判断、写作和执行时,单代理常见两种失败:上下文太挤越做越乱、串行太慢时间全花在排队上。
请把这个任务拆成 3 路并行: 1)事实卡 2)对比表 3)风险与试点计划 主代理最后只做整合、去重和补洞。
个人能用,不等于团队能用。团队落地最常见的阻力是:入口不统一、权限不清楚、非技术同事不愿意学新工具。
后者可接 Open WebUI、LobeChat、LibreChat 等支持 OpenAI-compatible 接口的前端。
| 你现在最缺什么 | 先做哪一个 |
|---|---|
| 信息持续追踪 | 个人知识助手 |
| 稳定产出内容 | 内容创作流水线 |
| 工程提醒和回传 | Webhook 自动化 |
| 复杂任务拆解 | 多代理并行 |
| 团队统一入口 | Slack / API Server |
先做"只读、汇总、提醒、结构化回传"这类价值大但风险低的自动化。不要一开始就追求能改代码、能发版、能删数据。
Hermes 最危险的地方,不是"回答错了",而是工具真的会执行。这一部分要建立一套"默认安全"的运行方式——没有它,自动化就是事故预备役。
| 层 | 你要控制什么 |
|---|---|
| 入口层 | 谁能跟它说话、谁能触发任务 |
| 工具层 | 它能调用什么工具、什么动作要审批 |
| 执行层 | 命令在哪跑、是否隔离、是否可回滚 |
官方配置和最佳实践里,重点指向这几件事:allowlist · terminal backend · Docker sandbox · secret 管理 · 审批边界。
| 动作类型 | 可以自动做吗 | 建议 |
|---|---|---|
| 资料整理、摘要、对比表 | 可以 | 这是最适合先自动化的部分 |
| 提醒、日报、周报初稿 | 可以 | 但建议保留最终确认 |
| 写评论、发群内通知 | 可以,但要限定范围 | 先白名单,再审批 |
| 改代码、改配置、跑迁移 | 不建议默认自动 | 必须审批并可回滚 |
| 发版、删数据、对外公告、付款 | 不可以默认自动 | 必须人工拍板 |
如果接下来需要执行高风险动作,请先输出: 1)将要做什么 2)风险是什么 3)回滚方式是什么 4)哪一步必须人工确认 在我明确批准前,不要执行。
很多团队不是用不好 Hermes,而是没有路线图:第一天太兴奋什么都想试、第三天开始怀疑值不值得继续、第七天就不了了之。
CLI / Telegram / Slack / API Server
allowlist / 审批 / 隔离执行 / 密钥管理
Memory / Skills / Cron / Context Files
Hermes 不是用来替代责任人的。它适合替你跑流程、提建议、做汇总、做提醒,但高风险动作必须有人兜底。
前面章节里散布的 6 个模板汇总于此,方便你直接复制使用。每个对应一个核心场景。
| 模板 | 用于 | 位置 |
|---|---|---|
| ① 第一次对话 | 建立工作助理身份 | §09 |
| ② 日报 Skill | 固定日报格式 | §11 |
| ③ 长期项目开场 | 启动 2 周以上项目 | §12 |
| ④ 内容流水线 | 拆解写作任务 | §13 |
| ⑤ 并行调研 | 3 路并行子代理 | §15 |
| ⑥ 安全审批 | 高风险动作前必经 | §17 |
如果你刚看完这份手册,最好的下一步不是继续收藏更多资料,而是立刻做出一个最小闭环。
当你真正跑通这个闭环以后,Hermes 才会从"看起来很强的 Agent"变成"真的能替你承担一部分工作的后台系统"。