whoami --hermes
一个号称能「自主跑完整软件工程任务」的命令行 agent。
真的好用?还是又一轮营销?—— 我连续跑了 72 小时,告诉你答案。
cat chapter_01.md
从 brew install hermes 到第一次 prompt —— 一共 4 分 22 秒。
cold start → first-successful-task 三次平均
hermes run "refactor auth module to use pkce"
# hermes v0.9.2 · session 42a1 [plan] "分析 src/auth/*.ts → 找 oauth flow → 抽成 pkce" [read] src/auth/oauth.ts // 214 lines [read] src/auth/token.ts // 88 lines [think] "发现 implicit flow,改为 code+pkce,需新 state param" [edit] src/auth/oauth.ts +43 -17 [edit] src/auth/token.ts +12 -4 [test] pnpm vitest auth PASS 18/18 [commit] "feat(auth): migrate to oauth2 code+pkce" [push] origin feat/pkce-auth ok # 总耗时 3m 14s · 14k tokens · $0.21
同一组 48 个 GitHub issue,两个 agent 各跑一遍
echo $VERDICT
值得装,还不值得完全依赖。
三条命令,不到 5 分钟就能看见它干第一件事。
# 1. install $ brew install hermes-agent/tap/hermes # 2. auth (先准备好 anthropic api key) $ hermes auth login # 3. first task $ cd ~/your-repo && hermes run "add a CHANGELOG.md from git log"
exit 0
完整 trace、48 个任务的 PR 列表、benchmark 脚本都在 github.com/lewis/hermes-review