Showing Posts From

Ai agent

Brody
2026/05/25
- AI & Vibe Coding

Hermes Agent vs OpenClaw：2026 年两个最火开源 AI Agent 的终极对比

2026 年的开源 AI Agent 圈子，有两个项目你必须知道。一个是 OpenClaw——2026 年 3 月超越 React 成为 GitHub 最高星标项目，目前 350k+ Stars，从一个个人副项目变成了现象级开源基础设施。另一个是 Hermes Agent——Nous Research 出品，167k Stars，自称「唯一内置学习循环的 Agent」，核心卖点是越用越聪明。如果你正在犹豫该用哪个（或者两个都想试试），这篇文章帮你把核心差异讲清楚。一句话定位它们不是竞品，而是两条完全不同的路线：OpenClaw Hermes Agent一句话让你定义规则，让 AI 执行让 AI 自己学会做事代表路线广度连接——接入最多的平台深度进化——越用越懂你核心角色执行者（Doer）学习者（Learner）比喻万能遥控器会成长的徒弟五大维度深度对比 1. 架构与安全：CVE 教会了我们什么？这是两个项目最根本的设计分歧。 OpenClaw 采用单进程架构——工具、集成、平台适配器全部运行在同一个地址空间。这种设计带来的好处是启动快、部署简单、资源占用低。但代价也在 2026 年 2 月暴露了：CVE-2026-25253：未认证的远程代码执行（RCE），CVSS 评分 8.8（高危），数万个未打补丁的实例被入侵。之后 OpenClaw 引入了 AgentWard（eBPF 探针监控）、SkillFortify（技能形式化验证）、Raypher（硬件身份认证）等安全组件，但本质上是在修补一个默认不隔离的架构。 Hermes Agent 从第一天起就是分层隔离架构：平台适配器 → 网关进程 → Agent 运行时（受控接口）→ 工具执行（沙盒）平台网关无法直接访问 Agent 运行时，工具执行默认在沙盒内。截至 2026 年 5 月，Hermes Agent 没有已知的 CVE。💡 安全总结：OpenClaw 靠补丁堆砌安全，Hermes Agent 靠架构从源头限制爆炸半径。2. 记忆系统：谁记得更牢？记忆系统是 AI Agent 的「大脑」。 OpenClaw 的记忆以 Markdown 文件为基础载体（SOUL.md、AGENTS.md 等），通过 Dinobase 提供生产级持久化存储。高级记忆功能（向量检索、知识图谱）需要额外安装插件。整体来说，手动可控，但需要深度定制。 Hermes Agent 的记忆是架构级原生设计：会话历史存储在 SQLite，支持 FTS5 全文检索每次对话前自动加载相关记忆和技能内置用户建模系统（集成 Honcho），持续积累你的沟通风格和偏好零人工维护，全自动沉淀💡 记忆总结：Hermes 是懒人友好型——你什么都不用做，它自己记；OpenClaw 是控制狂友好型——你想让它记什么，它就记什么。3. 技能机制：最核心的差异这是两者最本质的区别。 OpenClaw 的技能是人工编写 + 社区下载的。你需要去 ClawHub 技能市场搜索、安装、管理插件。生态成熟，技能数量丰富，但每次执行相同任务，Agent 都需要重新规划。 Hermes Agent 的技能是自动生成 + 自我进化的：解决任务 → 记录技能文档 → 下次遇到类似任务 → 直接调用缓存技能 → 跳过规划阶段完成一个复杂任务后，Agent 会自动调用 skill_manage 工具生成一份标准技能文档，记录解决方法、遇到的陷阱、边界情况。使用过程中发现问题，还会通过 patch 动作精准优化。 Nous Research 内部基准测试显示，经过数周技能积累后，研究任务完成速度提升约 40%。💡 技能总结：OpenClaw 是「用现成技能」，Hermes 是「自己造技能」。短期 OpenClaw 更快（生态成熟），长期 Hermes 的复利效应更明显。4. 平台覆盖：25+ vs 7 这是 OpenClaw 的绝对主场。 OpenClaw 覆盖 25+ 消息平台：WhatsApp、Telegram、Slack、Discord、Signal、Email、iMessage、Microsoft Teams、Google Chat、Matrix、飞书、微信、LINE、IRC、Twitch……而且所有渠道共享同一个 Agent 和本地记忆。 Hermes Agent 目前支持 7 个平台：Telegram、Discord、Slack、WhatsApp、Signal、Email、CLI。能力 OpenClaw Hermes Agent消息平台 25+ 7语音模式支持不支持伴侣 App macOS + iOS + Android 无浏览器控制支持通过 MCPiMessage 独占不支持💡 覆盖总结：如果你需要接入微信、飞书、iMessage 等平台，OpenClaw 目前没有对手。5. 成本与部署两者的软件本身都免费开源。主要成本在 LLM API 调用。如果你搭配 Ollama + 本地开源模型，两者都可以实现零 API 成本。维度 OpenClaw Hermes Agent安装 npm install -g openclaw 一键脚本（curl | bash）配置复杂度简单上手，深度配置需学习稍复杂，但后续自进化降低长期成本运行环境 Node.js（轻量） Python（稍重）Serverless 支持无 Modal / Daytona（空闲时近乎零成本）💡 成本总结：两者都可以用最低 5$/月的 VPS 跑起来。Hermes 的 Serverless 后端是一个额外优势——不干活时不花钱。综合评分对比维度 OpenClaw Hermes Agent 胜出渠道覆盖 25+ 平台 7 平台 OpenClaw设备集成语音/App/设备控制 CLI 为主 OpenClaw安全架构补丁堆砌分层隔离，零 CVE Hermes自我进化不支持闭环学习，+40% 效率 Hermes跨会话记忆插件依赖，手动维护 FTS5 原生，全自动 Hermes技能生态成熟丰富，即装即用自动生成，复利增长平手数据主权本地优先，完全可控未特别强调 OpenClaw安装便捷一行 npm 命令一键脚本平手你该怎么选？选 OpenClaw 的场景你是个人用户，需要接入微信、飞书、iMessage 等平台你需要语音交互或 macOS/iOS/Android 伴侣 App 你重视数据主权，所有数据留在本地你已经有成熟的技能工作流，不需要 Agent 自己学选 Hermes Agent 的场景你希望 Agent 越用越聪明，自动积累经验你处理高重复度工作流（定期报告、代码审查、数据清洗）你运行敏感工作流，需要默认沙盒保护你是开发者或研究者，需要技能的复利效应组合方案两者并非对立，可以搭配使用：Hermes Agent 做指挥中心（记忆沉淀、技能生成、任务规划），OpenClaw 做执行端（利用多平台能力完成具体操作），实现自动成长 + 高效执行的能力互补。迁移指南如果你已经在用 OpenClaw 想迁移到 Hermes Agent，好消息是 Hermes 内置了专用迁移工具： # 预览将迁移的内容 hermes claw migrate --dry-run# 执行迁移 hermes claw migrate迁移内容包括人格文件（SOUL.md）、记忆、技能、消息设置、API 密钥等。⚠️ 注意：OpenClaw 的 25+ 渠道中只有 7 个能迁移到 Hermes。如果依赖 iMessage、飞书、微信等独占渠道，建议两者并存。写在最后 2026 年的 AI Agent 赛道，OpenClaw 和 Hermes Agent 代表了两种截然不同的设计哲学：OpenClaw 相信「人是决策中心」——你定义规则，AI 执行 Hermes Agent 相信「AI 可以自己进化」——你给机会，AI 成长没有绝对的对错，只有是否匹配你的需求。但有一点是确定的：AI Agent 的未来，一定是这两条路线的融合——既要有 OpenClaw 的广度连接能力，也要有 Hermes 的深度进化能力。现在，你想让 AI 做你的遥控器，还是做你的学徒？参考来源：Nous Research GitHub、OpenClaw 官方文档及社区对比分析

Brody
2026/05/21
- AI & Vibe Coding

MCP 与 Skill：搞清楚 AI 能力扩展的两个核心概念

在 AI 和智能体（Agent）开发领域，MCP（Model Context Protocol，模型上下文协议）和 Skill虽然都与「扩展 AI 的能力」有关，但它们处于完全不同的架构层级。简单来说：MCP 是「接口标准」，而 Skill 是具体的「功能实现」。就像 MCP 是电脑上的 USB 接口协议，而 Skill 则是插在这个接口上的 U 盘、鼠标或打印机。核心概念对比 MCP (Model Context Protocol) MCP 是由 Anthropic 开源的一种标准化通信协议。它解决的是「AI 模型如何安全、统一地连接外部数据源和工具」的问题。本质：一套 Client-Server 架构的底层基础设施。作用：过去，开发者要让 AI 查数据库、读本地文件、调用外部 API，需要为每个平台写定制化的集成代码。MCP 提供了一套通用标准，只要数据源封装成了「MCP Server」，任何支持 MCP 的 AI 客户端（如 Claude Desktop、Cursor、各类 IDE 插件）都可以无缝接入，读取上下文或调用工具。关注点：安全性、连接性、标准化、跨平台。Skill (技能) Skill 通常指的是 AI Agent 能够执行的具体任务或业务逻辑。这个概念在 AI 行业存在已久（比如 Amazon Alexa Skills，或者智能体框架中的 Tools/Actions）。本质：封装好的业务能力。作用：赋予 AI 完成特定指令的能力。例如：「搜索网络」、「查询天气」、「总结指定的本地 PDF 代码库」、「在 Jira 中创建一个 Bug 工单」。关注点：业务逻辑、Prompt 设计、输入输出的处理。详细区别 {% table %}维度 MCP (模型上下文协议) Skill (技能)层级定位底层/架构层 (Infrastructure) 上层/应用层 (Application/Logic)核心问题 AI 如何与外部世界建立标准化的连接？ AI 能够为用户完成什么具体任务？通用性极高。跨平台、跨模型通用。较低。通常依赖具体的提示词或特定的 AI 框架。开发对象开发「MCP Server」，定义资源（Resources）和工具（Tools）的暴露方式。编写代码逻辑或 Prompt，定义输入参数、执行动作和输出结果。 {% /table %}它们是如何协同工作的？在现代的 AI 架构中，MCP 往往是实现 Skill 的底层通道。假设你正在为运维团队开发一个基于 RAG（检索增强生成）的企业知识库系统：没有 MCP 之前开发 Skill：你需要写一个大长串的 Python 脚本，直接把 AI 的 API 和公司内部的 Confluence API 绑死在一起。这个「查文档」的 Skill 只能在你的代码库里运行。使用 MCP 之后开发 Skill：你开发一个连接 Confluence 的 MCP Server。这个 Server 向外暴露了一个叫 search_internal_docs 的 Skill（或 Tool）。现在，不仅是你自己写的代码，团队里的开发者用 Cursor 写代码时，或者用 Claude 客户端聊天时，只要连接了这个 MCP Server，他们的 AI 就瞬间具备了「查询公司内部运维文档」的 Skill。总结：你可以通过 MCP 协议，将各种强大的 Skill 标准化地分发给不同的 AI 应用。有了 MCP，为什么还到处是 Skill？这是一个很敏锐的问题。你可能会觉得：「既然已经有了一个统一的底层协议（MCP），为什么还要反复强调或者大量去写上层的 Skill 呢？」其实，MCP 的出现不仅没有消灭 Skill，反而直接促成了 Skill 的「大爆发」。像 Claude、Cursor 现在之所以大量依赖 Skill，正是因为 MCP 把开发和接入 Skill 的门槛降到了前所未有的低。 1. 模型本质上是「缸中之脑」，它永远需要手和眼无论是多么强大的大语言模型（Claude 3.5 Sonnet、GPT-4o），它们的本质都只是一个「文本预测引擎」。如果没有任何外部工具，它们既不知道现在是几点，也无法读取你 MacBook 上的本地文件，更无法帮你执行终端命令。Skill 就是 AI 的手和眼睛（例如：读取本地文件、执行终端命令、搜索网页）。 MCP 是连接大脑（AI）和手眼（Skill）的神经系统。神经系统再好，没有手眼也干不了活。因此，要想让 AI 真正帮你干活，依然需要大量具体的 Skill。 2. 「解耦」带来了类似 App Store 的效应在 MCP 出现之前，如果 AI 厂商想让 AI 拥有一个新 Skill（比如「读取本地代码库」），他们必须亲自在自己的客户端里硬编码写死这套逻辑。这导致 AI 能干的事情非常受限。有了 MCP 之后，发生了类似「苹果推出 App Store」的效应：以前： Claude 团队自己吭哧吭哧写几百个集成逻辑。现在： Claude 只需要说「我支持 MCP 协议」。然后，全世界的开发者就可以用几行代码写出一个「读取本地 Git 仓库」的 Skill，或者「查询 Jira 状态」的 Skill，封装成 MCP Server 喂给 Claude。正因为 MCP 提供了一个标准的「插座」，现在任何开发者都可以轻松地把成千上万个 Skill（U盘）插到 Claude 这个主机上。 3. 具体到代码开发场景假设你在本地 macOS 环境下进行开发，遇到了依赖管理或编译报错的问题，AI 需要帮你排查。AI 要真正解决问题，它可能需要调用以下几个 Skill：read_file：读取你本地的配置文件 execute_command：在你的终端跑一下相关的环境检查命令 search_internal_knowledge：去你们公司的内部运维知识库检索在这个过程中，MCP 和 Skill 是如何配合的？Claude/Cursor 客户端会通过 MCP 协议与你本地机器上的服务建立安全连接。通过这个连接，AI 会发现你暴露给了它上述三个 Skill（工具）。 AI 大脑经过思考后决定：「为了排查这个依赖报错，我需要调用 execute_command 这个 Skill。」一句话总结 MCP 是修好的高速公路，而 Skill 是跑在上面的货车。正因为高速公路（MCP）修通了且标准统一了，你才会看到现在马路上跑着比以前多得多的货车（Skill），去帮你运送数据、执行任务。未来，随着企业知识库、自动化工作流的普及，这种原子化的 Skill 只会越来越多。搞清楚这两个层级的关系，是理解 AI 工程化、构建真正有用的 AI Agent 系统的关键第一步。