Showing Posts From
Ai agent
-
Brody - 2026/05/25
Hermes Agent vs OpenClaw:2026 年两个最火开源 AI Agent 的终极对比
2026 年的开源 AI Agent 圈子,有两个项目你必须知道。 一个是 OpenClaw——2026 年 3 月超越 React 成为 GitHub 最高星标项目,目前 350k+ Stars,从一个个人副项目变成了现象级开源基础设施。 另一个是 Hermes Agent——Nous Research 出品,167k Stars,自称「唯一内置学习循环的 Agent」,核心卖点是越用越聪明。 如果你正在犹豫该用哪个(或者两个都想试试),这篇文章帮你把核心差异讲清楚。一句话定位 它们不是竞品,而是两条完全不同的路线:OpenClaw Hermes Agent一句话 让你定义规则,让 AI 执行 让 AI 自己学会做事代表路线 广度连接——接入最多的平台 深度进化——越用越懂你核心角色 执行者(Doer) 学习者(Learner)比喻 万能遥控器 会成长的徒弟五大维度深度对比 1. 架构与安全:CVE 教会了我们什么? 这是两个项目最根本的设计分歧。 OpenClaw 采用单进程架构——工具、集成、平台适配器全部运行在同一个地址空间。这种设计带来的好处是启动快、部署简单、资源占用低。但代价也在 2026 年 2 月暴露了:CVE-2026-25253:未认证的远程代码执行(RCE),CVSS 评分 8.8(高危),数万个未打补丁的实例被入侵。之后 OpenClaw 引入了 AgentWard(eBPF 探针监控)、SkillFortify(技能形式化验证)、Raypher(硬件身份认证)等安全组件,但本质上是在修补一个默认不隔离的架构。 Hermes Agent 从第一天起就是分层隔离架构: 平台适配器 → 网关进程 → Agent 运行时(受控接口)→ 工具执行(沙盒)平台网关无法直接访问 Agent 运行时,工具执行默认在沙盒内。截至 2026 年 5 月,Hermes Agent 没有已知的 CVE。💡 安全总结:OpenClaw 靠补丁堆砌安全,Hermes Agent 靠架构从源头限制爆炸半径。2. 记忆系统:谁记得更牢? 记忆系统是 AI Agent 的「大脑」。 OpenClaw 的记忆以 Markdown 文件为基础载体(SOUL.md、AGENTS.md 等),通过 Dinobase 提供生产级持久化存储。高级记忆功能(向量检索、知识图谱)需要额外安装插件。整体来说,手动可控,但需要深度定制。 Hermes Agent 的记忆是架构级原生设计:会话历史存储在 SQLite,支持 FTS5 全文检索 每次对话前自动加载相关记忆和技能 内置用户建模系统(集成 Honcho),持续积累你的沟通风格和偏好 零人工维护,全自动沉淀💡 记忆总结:Hermes 是懒人友好型——你什么都不用做,它自己记;OpenClaw 是控制狂友好型——你想让它记什么,它就记什么。3. 技能机制:最核心的差异 这是两者最本质的区别。 OpenClaw 的技能是人工编写 + 社区下载的。你需要去 ClawHub 技能市场搜索、安装、管理插件。生态成熟,技能数量丰富,但每次执行相同任务,Agent 都需要重新规划。 Hermes Agent 的技能是自动生成 + 自我进化的: 解决任务 → 记录技能文档 → 下次遇到类似任务 → 直接调用缓存技能 → 跳过规划阶段完成一个复杂任务后,Agent 会自动调用 skill_manage 工具生成一份标准技能文档,记录解决方法、遇到的陷阱、边界情况。使用过程中发现问题,还会通过 patch 动作精准优化。 Nous Research 内部基准测试显示,经过数周技能积累后,研究任务完成速度提升约 40%。💡 技能总结:OpenClaw 是「用现成技能」,Hermes 是「自己造技能」。短期 OpenClaw 更快(生态成熟),长期 Hermes 的复利效应更明显。4. 平台覆盖:25+ vs 7 这是 OpenClaw 的绝对主场。 OpenClaw 覆盖 25+ 消息平台:WhatsApp、Telegram、Slack、Discord、Signal、Email、iMessage、Microsoft Teams、Google Chat、Matrix、飞书、微信、LINE、IRC、Twitch……而且所有渠道共享同一个 Agent 和本地记忆。 Hermes Agent 目前支持 7 个平台:Telegram、Discord、Slack、WhatsApp、Signal、Email、CLI。能力 OpenClaw Hermes Agent消息平台 25+ 7语音模式 支持 不支持伴侣 App macOS + iOS + Android 无浏览器控制 支持 通过 MCPiMessage 独占 不支持💡 覆盖总结:如果你需要接入微信、飞书、iMessage 等平台,OpenClaw 目前没有对手。5. 成本与部署 两者的软件本身都免费开源。 主要成本在 LLM API 调用。如果你搭配 Ollama + 本地开源模型,两者都可以实现零 API 成本。维度 OpenClaw Hermes Agent安装 npm install -g openclaw 一键脚本(curl | bash)配置复杂度 简单上手,深度配置需学习 稍复杂,但后续自进化降低长期成本运行环境 Node.js(轻量) Python(稍重)Serverless 支持 无 Modal / Daytona(空闲时近乎零成本)💡 成本总结:两者都可以用最低 5$/月的 VPS 跑起来。Hermes 的 Serverless 后端是一个额外优势——不干活时不花钱。综合评分对比维度 OpenClaw Hermes Agent 胜出渠道覆盖 25+ 平台 7 平台 OpenClaw设备集成 语音/App/设备控制 CLI 为主 OpenClaw安全架构 补丁堆砌 分层隔离,零 CVE Hermes自我进化 不支持 闭环学习,+40% 效率 Hermes跨会话记忆 插件依赖,手动维护 FTS5 原生,全自动 Hermes技能生态 成熟丰富,即装即用 自动生成,复利增长 平手数据主权 本地优先,完全可控 未特别强调 OpenClaw安装便捷 一行 npm 命令 一键脚本 平手你该怎么选? 选 OpenClaw 的场景你是个人用户,需要接入微信、飞书、iMessage 等平台 你需要语音交互或 macOS/iOS/Android 伴侣 App 你重视数据主权,所有数据留在本地 你已经有成熟的技能工作流,不需要 Agent 自己学选 Hermes Agent 的场景你希望 Agent 越用越聪明,自动积累经验 你处理高重复度工作流(定期报告、代码审查、数据清洗) 你运行敏感工作流,需要默认沙盒保护 你是开发者或研究者,需要技能的复利效应组合方案 两者并非对立,可以搭配使用:Hermes Agent 做指挥中心(记忆沉淀、技能生成、任务规划),OpenClaw 做执行端(利用多平台能力完成具体操作),实现自动成长 + 高效执行的能力互补。迁移指南 如果你已经在用 OpenClaw 想迁移到 Hermes Agent,好消息是 Hermes 内置了专用迁移工具: # 预览将迁移的内容 hermes claw migrate --dry-run# 执行迁移 hermes claw migrate迁移内容包括人格文件(SOUL.md)、记忆、技能、消息设置、API 密钥等。⚠️ 注意:OpenClaw 的 25+ 渠道中只有 7 个能迁移到 Hermes。如果依赖 iMessage、飞书、微信等独占渠道,建议两者并存。写在最后 2026 年的 AI Agent 赛道,OpenClaw 和 Hermes Agent 代表了两种截然不同的设计哲学:OpenClaw 相信「人是决策中心」——你定义规则,AI 执行 Hermes Agent 相信「AI 可以自己进化」——你给机会,AI 成长没有绝对的对错,只有是否匹配你的需求。但有一点是确定的:AI Agent 的未来,一定是这两条路线的融合——既要有 OpenClaw 的广度连接能力,也要有 Hermes 的深度进化能力。 现在,你想让 AI 做你的遥控器,还是做你的学徒?参考来源:Nous Research GitHub、OpenClaw 官方文档及社区对比分析
-
Brody - 2026/05/21
MCP 与 Skill:搞清楚 AI 能力扩展的两个核心概念
在 AI 和智能体(Agent)开发领域,MCP(Model Context Protocol,模型上下文协议) 和 Skill虽然都与「扩展 AI 的能力」有关,但它们处于完全不同的架构层级。 简单来说:MCP 是「接口标准」,而 Skill 是具体的「功能实现」。 就像 MCP 是电脑上的 USB 接口协议,而 Skill 则是插在这个接口上的 U 盘、鼠标或打印机。核心概念对比 MCP (Model Context Protocol) MCP 是由 Anthropic 开源的一种标准化通信协议。它解决的是「AI 模型如何安全、统一地连接外部数据源和工具」的问题。本质: 一套 Client-Server 架构的底层基础设施。 作用: 过去,开发者要让 AI 查数据库、读本地文件、调用外部 API,需要为每个平台写定制化的集成代码。MCP 提供了一套通用标准,只要数据源封装成了「MCP Server」,任何支持 MCP 的 AI 客户端(如 Claude Desktop、Cursor、各类 IDE 插件)都可以无缝接入,读取上下文或调用工具。 关注点: 安全性、连接性、标准化、跨平台。Skill (技能) Skill 通常指的是 AI Agent 能够执行的具体任务或业务逻辑。这个概念在 AI 行业存在已久(比如 Amazon Alexa Skills,或者智能体框架中的 Tools/Actions)。本质: 封装好的业务能力。 作用: 赋予 AI 完成特定指令的能力。例如:「搜索网络」、「查询天气」、「总结指定的本地 PDF 代码库」、「在 Jira 中创建一个 Bug 工单」。 关注点: 业务逻辑、Prompt 设计、输入输出的处理。详细区别 {% table %}维度 MCP (模型上下文协议) Skill (技能)层级定位 底层/架构层 (Infrastructure) 上层/应用层 (Application/Logic)核心问题 AI 如何与外部世界建立标准化的连接? AI 能够为用户完成什么具体任务?通用性 极高。跨平台、跨模型通用。 较低。通常依赖具体的提示词或特定的 AI 框架。开发对象 开发「MCP Server」,定义资源(Resources)和工具(Tools)的暴露方式。 编写代码逻辑或 Prompt,定义输入参数、执行动作和输出结果。 {% /table %}它们是如何协同工作的? 在现代的 AI 架构中,MCP 往往是实现 Skill 的底层通道。 假设你正在为运维团队开发一个基于 RAG(检索增强生成)的企业知识库系统: 没有 MCP 之前开发 Skill: 你需要写一个大长串的 Python 脚本,直接把 AI 的 API 和公司内部的 Confluence API 绑死在一起。这个「查文档」的 Skill 只能在你的代码库里运行。 使用 MCP 之后开发 Skill:你开发一个连接 Confluence 的 MCP Server。 这个 Server 向外暴露了一个叫 search_internal_docs 的 Skill(或 Tool)。 现在,不仅是你自己写的代码,团队里的开发者用 Cursor 写代码时,或者用 Claude 客户端聊天时,只要连接了这个 MCP Server,他们的 AI 就瞬间具备了「查询公司内部运维文档」的 Skill。总结:你可以通过 MCP 协议,将各种强大的 Skill 标准化地分发给不同的 AI 应用。有了 MCP,为什么还到处是 Skill? 这是一个很敏锐的问题。你可能会觉得:「既然已经有了一个统一的底层协议(MCP),为什么还要反复强调或者大量去写上层的 Skill 呢?」 其实,MCP 的出现不仅没有消灭 Skill,反而直接促成了 Skill 的「大爆发」。像 Claude、Cursor 现在之所以大量依赖 Skill,正是因为 MCP 把开发和接入 Skill 的门槛降到了前所未有的低。 1. 模型本质上是「缸中之脑」,它永远需要手和眼 无论是多么强大的大语言模型(Claude 3.5 Sonnet、GPT-4o),它们的本质都只是一个「文本预测引擎」。如果没有任何外部工具,它们既不知道现在是几点,也无法读取你 MacBook 上的本地文件,更无法帮你执行终端命令。Skill 就是 AI 的手和眼睛(例如:读取本地文件、执行终端命令、搜索网页)。 MCP 是连接大脑(AI)和手眼(Skill)的神经系统。神经系统再好,没有手眼也干不了活。因此,要想让 AI 真正帮你干活,依然需要大量具体的 Skill。 2. 「解耦」带来了类似 App Store 的效应 在 MCP 出现之前,如果 AI 厂商想让 AI 拥有一个新 Skill(比如「读取本地代码库」),他们必须亲自在自己的客户端里硬编码写死这套逻辑。这导致 AI 能干的事情非常受限。 有了 MCP 之后,发生了类似「苹果推出 App Store」的效应:以前: Claude 团队自己吭哧吭哧写几百个集成逻辑。 现在: Claude 只需要说「我支持 MCP 协议」。然后,全世界的开发者就可以用几行代码写出一个「读取本地 Git 仓库」的 Skill,或者「查询 Jira 状态」的 Skill,封装成 MCP Server 喂给 Claude。正因为 MCP 提供了一个标准的「插座」,现在任何开发者都可以轻松地把成千上万个 Skill(U盘)插到 Claude 这个主机上。 3. 具体到代码开发场景 假设你在本地 macOS 环境下进行开发,遇到了依赖管理或编译报错的问题,AI 需要帮你排查。AI 要真正解决问题,它可能需要调用以下几个 Skill:read_file:读取你本地的配置文件 execute_command:在你的终端跑一下相关的环境检查命令 search_internal_knowledge:去你们公司的内部运维知识库检索在这个过程中,MCP 和 Skill 是如何配合的?Claude/Cursor 客户端 会通过 MCP 协议 与你本地机器上的服务建立安全连接。 通过这个连接,AI 会发现你暴露给了它上述三个 Skill(工具)。 AI 大脑经过思考后决定:「为了排查这个依赖报错,我需要调用 execute_command 这个 Skill。」一句话总结 MCP 是修好的高速公路,而 Skill 是跑在上面的货车。 正因为高速公路(MCP)修通了且标准统一了,你才会看到现在马路上跑着比以前多得多的货车(Skill),去帮你运送数据、执行任务。 未来,随着企业知识库、自动化工作流的普及,这种原子化的 Skill 只会越来越多。搞清楚这两个层级的关系,是理解 AI 工程化、构建真正有用的 AI Agent 系统的关键第一步。