Published on

에이전트가 나를 기억하기 시작했다 — Hermes Agent 설치부터 텔레그램 연동까지

Authors
  • Name
    Twitter

요즘 같이 하루에도 엄청난 정보들이 쏟아지는 때에 AI 에이전트 툴 하나 더 나왔다고 설치하는 일은 이제 좀 피곤하다. 근데 이번 건 좀 달랐다.

Nous Research가 올해 초에 공개하자마자 깃허브 스타 수천 개를 찍고, 3월 지나면서 6만 개를 훌쩍 넘긴 그 프로젝트. 이름은 그리스 신화 속 전령의 신 헤르메스에서 따왔는데, 실제로 전령 역할을 하긴 한다. 다만 내가 심부름을 시킬 때마다 똑같은 설명을 반복하지 않아도 되는, 점점 나를 알아가는 전령이다.

오늘은 이 친구가 뭐길래 다들 갈아탄다고 하는지, OpenClaw랑 뭐가 다른지, 그리고 윈도우랑 맥에서 어떻게 설치 하는지 알아보자.

Hermes Agent가 정확히 뭔데?

공식 슬로건부터 맛있다. "The agent that grows with you." 번역하면 "당신과 함께 성장하는 에이전트"쯤 되는데, 마케팅 카피치고는 꽤 정직하다. 써보면 진짜 그렇다.

기존 AI 챗봇이나 코딩 에이전트의 가장 큰 불편함이 뭐였냐면, 매번 똑같은 설명을 해야 한다는 점이었다. Claude Code도, Codex도 좋긴 한데 세션이 끝나면 내 프로젝트 구조, 코딩 컨벤션, 자주 쓰는 명령어 같은 걸 몽땅 까먹는다. 어제 3시간 걸려서 설명해준 프로젝트 맥락이 오늘 아침엔 온데간데없다. 그래서 개발자들이 CLAUDE.md니 뭐니 마크다운 파일에 뇌를 옮겨 적는 우스운 짓을 하고 있었다.

Hermes는 이 문제를 구조적으로 풀었다. 핵심은 세 가지다.

첫째, 스스로 관리하는 장기 기억이 있다. 주기적으로 "지금 기억해둘 만한 게 있나?"를 본인이 판단한다. 내가 "이거 기억해"라고 지시하지 않아도 알아서 저장한다. 사용자 프로파일링은 Honcho라는 변증법적 모델링 레이어가 담당하고, 과거 세션은 SQLite FTS5 전문 검색으로 뒤진다. 말하자면 기억력 구조 자체가 4층짜리로 설계된 셈이다.

둘째, 작업 과정을 스킬로 만들어 쌓는다. 어떤 문제를 해결하고 나면, 그 풀이 과정을 재사용 가능한 스킬 문서로 자동 생성한다. 다음에 비슷한 상황이 오면 그 스킬을 꺼내 쓴다. 요리사가 처음엔 레시피 보면서 시작했다가 점점 자기 노하우가 생기는 것과 같은 원리다. 이 스킬들은 ~/.hermes/skills/에 저장되고, agentskills.io 오픈 표준과도 호환된다.

셋째, 모델을 갈아끼울 수 있다. 이게 생각보다 크다. Claude Code는 Claude에, Codex는 GPT 계열에 묶여 있는데, Hermes는 hermes model 명령어 하나면 Nous Portal, OpenRouter(200개 넘는 모델), OpenAI, z.ai/GLM, Kimi/Moonshot, 자체 엔드포인트까지 다 전환된다. 코드 한 줄 안 바꾸고 설정만 바꿔서.

OpenClaw 대비 뭐가 더 낫나

hermes vs openclaw hermes와 openclaw의 차이를 보여준다

지난 몇 달 AI 에이전트 판에서 가장 뜨거웠던 주인공은 단연 OpenClaw였다. Peter Steinberger가 만든 그 물건, 깃허브 스타만 34만 개가 넘었고 커뮤니티 스킬이 5,700개나 올라와 있다. 엄청난 생태계다. 근데 왜 사람들이 Hermes로 갈아타기 시작했냐.

첫 번째 이유는 아키텍처 철학의 차이다. OpenClaw는 Gateway라는 중앙 통제 프로세스를 두고 모든 게 여기로 흐르는 구조다. 메시지 라우팅, 세션 관리, 도구 실행이 전부 Gateway를 거쳐간다. 쉽게 말해 메시징 게이트웨이를 중심에 두고 그 위에 에이전트를 얹은 형태다. 반면 Hermes는 반대다. 학습하는 에이전트가 중심에 있고, 메시징 채널이 그 주변에 붙는 구조다.

뭐가 다른데? OpenClaw는 스킬을 사용자가 써서 붙이는 구조고, Hermes는 에이전트가 스킬을 스스로 만드는 구조다. 이 차이가 써보면 체감된다. OpenClaw로는 내가 뭔가를 계속 "설정"해줘야 하는데, Hermes는 쓰다 보면 자기가 알아서 학습한다.

두 번째는 안정성과 보안이다. OpenClaw는 올해 2월에 CVE-2026-25253이라는 꽤 골치 아픈 취약점이 보고됐다. 그 이후로도 크고 작은 보안 이슈가 계속 나오는 중이다. 게다가 도구 호출이 많아지면 가끔 끊기는 현상도 있어서 실사용에서 답답한 순간이 있다. Hermes는 기본 보안 정책이 보수적이다. 설치부터 실행까지 sudo를 요구하지 않고, 명령어 허용 목록도 엄격하게 관리된다. 개발자 페터 슈타인베르거가 2월에 OpenAI로 이직하면서 OpenClaw 개발이 독립 재단으로 넘어간 것도, 사용자 입장에선 불안 요소로 작용하는 것 같다.

세 번째는 가벼움이다. Hermes는 설치 명령 한 줄로 끝난다. 필수 의존성도 Git 하나뿐이다. 월 5달러짜리 VPS에 올려도 멀쩡히 돌아간다. OpenClaw가 Node.js 22 이상을 요구하고 별도의 Gateway 프로세스를 띄워야 하는 것과는 결이 다르다.

물론 OpenClaw의 압도적인 생태계는 아직 유효하다. 당장 쓸 수 있는 스킬 수로만 따지면 비교가 안 된다. 근데 내가 반복하는 작업이 정해져 있고, 시간이 지날수록 똑똑해지는 조수를 원한다면 Hermes가 훨씬 맞는다는 게 최근 개발자 커뮤니티의 중론이다.

재밌는 건, 두 개를 같이 쓰는 사람도 꽤 있다는 점이다. Hermes를 "뇌"로 두고 OpenClaw를 "손"으로 쓰는 조합. 궁합이 생각보다 괜찮다고는 하는데, 나는 아직 거기까지는 안 가봤다.

설치하기

설치한 장비 목록

  • 리눅스: Minisforum AI X1 pro, HX370 96GB
  • 맥: Macbook pro M5 pro 48GB

맥(macOS) 설치

터미널 열고 이거 한 줄이면 된다.

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

이 스크립트가 알아서 uv, Python 3.11, Node.js, ripgrep, ffmpeg까지 다 깔아준다. sudo 권한도 안 건드린다. 깔끔하다. 설치가 끝나면 hermes 치는 순간 바로 CLI가 뜬다. 5단계짜리 셋업 위저드가 나오는데, LLM API 키 입력, 모델 선택, 도구 활성화, 게이트웨이 설정 이런 걸 순서대로 골라주면 끝난다.

이 모델이 좋은 점이 codex를 공식 지원한다는 점. OpenAI도 그렇게 생각하는지는 모르겠지만 어쨌든, 요금제 내에서 이용 가능하다.

윈도우 설치

내가 지금은 윈도우가 없어서(미니피씨를 리눅스 서버로 만들었다) 아래 내용은 참고만 하시라.

네이티브 윈도우 지원은 아직 실험 단계라 공식 문서도 WSL2 쓰라고 권장한다. PowerShell을 관리자 권한으로 열어서 아래 명령어를 실행하자.

wsl --install

재부팅 한 번 하고, Ubuntu가 깔리면 거기 들어가서 위에 적은 맥용 설치 명령어를 그대로 치면 된다. 즉 윈도우라기보단 윈도우 안의 리눅스에 까는 셈이다. 좀 번거롭지만 한 번만 세팅하면 그다음은 편하다.

로컬 모델로 돌리고 싶으면 Ollama + Gemma 4 조합이 괜찮다.

텔레그램 연동

진짜 재밌는 부분은 여기다. 텔레그램 앱에서 @BotFather 검색해서 대화를 열고, /newbot 명령으로 봇을 하나 만든다. 이름이랑 유저네임 정해주면 토큰이 하나 나오는데, 이게 핵심이다.

그다음 터미널에서 이걸 돌린다.

hermes gateway setup

플랫폼 목록에서 Telegram 고르고, 받은 토큰을 붙여넣으면 끝이다. 혼자만 쓸 거면 본인 텔레그램 유저 ID(@userinfobot에서 확인 가능)를 TELEGRAM_ALLOWED_USERS 환경변수에 꼭 넣어두자. 안 그러면 누구나 내 에이전트한테 말을 걸 수 있다. 별것 아닌 것 같지만 이게 실수로 빠뜨리면 진짜 큰일 난다.

백그라운드 서비스로 상주시키려면 이 두 줄.

hermes gateway install
hermes gateway start

맥은 launchd, 리눅스는 systemd로 자동 등록된다. 재부팅해도 살아 있다. 빈 VPS에서 텔레그램 메시지가 처음 도착할 때까지 보통 한두 시간이면 완성된다.

Telegram bot AI agent 텔레그램 봇으로 연결된 에이전트. 외출 중에도 폰으로 내 서버와 대화할 수 있다

일주일 써본 솔직한 후기

좋은 것만 적으면 광고 같으니까 단점부터 얘기하자.

첫째, 모델 선택이 결과를 반 이상 좌우한다. 공식 팁 문서에서도 "Hermes 실패 원인 1위가 잘못된 모델 선택"이라고 못 박아놨다. 저렴한 모델을 물리면 추론 체인이 중간에 엉키고, 스킬 생성도 허접해진다. 프론티어 모델 API(Claude Opus, GPT-5급) 아니면 제대로 된 성능이 안 나온다는 건 감안해야 한다. 달리 말하면, 에이전트는 공짜인데 LLM 요금은 계속 나간다는 뜻이기도 하다. Gemma4 26B으로도 돌려봤는데 내 피씨 사양에서는 아무래도 속도도 그렇고, 이미 결제되어 있는 codex를 사용하는 게 최선이었다. 그런데 좋은 점은 ChatGPT처럼 말이 너무 많지 않다는 것이다. 그 아이랑 대화하다 보면 기가 너무 빨려서 피곤하기 때문에.

둘째, 초기 며칠은 오히려 답답하다. 메모리가 쌓이기 전까진 일반 챗봇이랑 큰 차이가 없다. 일주일 정도 꾸준히 써야 "아, 얘가 나를 기억하네" 싶은 순간이 온다. 인내심이 필요한 타입이다. "즉각적 천재"보단 "느리게 친해지는 동료"에 가깝다.

그럼에도 계속 쓰게 된 이유는 명확하다. 외출 중에 텔레그램으로 **"오늘 서버 상태 어때?"**라고 보냈더니, 1분 뒤에 원인 분석이랑 해결 방법이 답장으로 왔다. 내가 지난주에 설명해둔 프로젝트 구조를 기억하고 있으니까 맥락 설명을 다시 할 필요가 없었다.

hermes answer 텔레그램 봇이 서버 상태를 확인하고 답장을 보내준다

크론 스케줄러도 의외로 강력하다. 매일 아침 7시에 내 깃 레포 변경사항을 요약해서 텔레그램으로 쏴달라고 해놨는데, 한 주 지나니까 요약 스타일이 자연스럽게 내가 원하는 형태로 잡혀갔다. "이런 건 빼고, 이런 건 강조해줘" 피드백 몇 번 줬더니 알아서 학습한 거다. 이게 바로 절차적 메모리의 힘이다.

블로그 10년 넘게 하면서 수많은 툴을 깔았다 지웠다 해본 입장에서 솔직히 말하면, Hermes Agent는 "매일 쓸 만한 물건"이다. 재미로 깔아보고 방치하는 수많은 툴들과 달리, 한 달째 텔레그램에 붙여놓고 매일 쓰고 있다. 이 정도면 추천할 이유는 충분하다.

마치며

요즘 AI 에이전트 판은 크게 두 방향으로 갈리고 있는 것 같다. 세션마다 빛나는 "폭발적 천재" 유형과, 시간이 지나면서 조용히 나와 맞아가는 "묵묵한 조수" 유형. 전자가 Claude Code 같은 거고, 후자가 Hermes Agent다.

둘 다 필요하다. 다만 매일 비슷한 일을 반복하는 사람이라면, 묵묵한 조수 쪽이 삶의 질을 훨씬 크게 바꿔준다. 한 번 세팅해두고 잊어도 되는 존재, 근데 부르면 어디서든 답하는 존재. 그게 Hermes가 지향하는 지점이다.

아직 안 깔아봤다면, 설치해보기를 추천한다. 재미있는 장난감에서부터 비서, 친구 하나를 얻을 수도 있다.