단 하나의 에이전트에 필요한 모든 것
Hermes Agent는 장기 기억, 자동 기술 생성, 멀티 플랫폼 연동을 하나의 오픈소스 패키지로 제공합니다.
사용자가 있는 곳에 상주
Telegram, Discord, Slack, WhatsApp, Signal, 이메일, CLI 등 지원 플랫폼이 지속적으로 확장됩니다. 한 곳에서 시작해 다른 곳에서 이어가세요.
실행할수록 똑똑하게 성장
장기 기억과 자동 생성 기술 덕분에 프로젝트를 학습하며, 한 번 해결한 문제의 해결 방법을 절대 잊지 않습니다.
예약된 자동화 작업
자연어로 보고서, 백업, 브리핑을 실행하는 cron 예약. 게이트웨이를 통해 백그라운드에서 자동 실행됩니다.
위임 및 병렬 처리
독립된 대화, 터미널, Python RPC 스크립트를 가진 격리된 서브에이전트로 컨텍스트 비용 없는 파이프라인을 구축합니다.
강력한 샌드박스
로컬, Docker, SSH, Singularity, Modal 등 5가지 백엔드 지원. 컨테이너 강화 및 네임스페이스 격리 제공.
웹 및 브라우저 제어
웹 검색, 브라우저 자동화, 비전, 이미지 생성, 음성 합성 및 다중 모델 협업 추론 지원.
핵심 기본 능력
장기 기억, 안전한 샌드박스 및 프로젝트 컨텍스트 발견
장기 기억 시스템
세션을 넘나들며 사용자의 선호도, 프로젝트 상세 정보, 과거 이력을 기억합니다 (MEMORY.md / USER.md).
지능형 컨텍스트 이해
프로젝트 컨텍스트 파일을 자동으로 로드하고 파일, 폴더, git diff, URL을 @로 쉽게 참조합니다.
모듈식 도구 및 기술
풍부한 내장 도구 세트와 필요에 따라 온디맨드로 추가 로드할 수 있는 기술들을 유연하게 통합.
보안 체크포인트
변경을 적용하기 전에 워크스페이스 디렉토리의 스냅샷을 자동으로 찍어 원클릭 롤백을 지원합니다.
자동화 및 워크플로
백그라운드 작업, 스케줄링 및 다중 에이전트 협업 시스템
예약 작업 (Cron)
자연어 또는 cron 식을 사용하여 워크플로를 예약하고 완전히 자동화된 실행을 구현합니다.
서브에이전트 위임
여러 하위 에이전트 인스턴스를 동시에 실행하여 병렬 워크스트림을 처리합니다.
샌드박스 코드 실행
안전하게 격리된 샌드박스 내부에서 Python 스크립트를 실행하여 복잡한 다단계 작업을 완료합니다.
일괄 처리
대량의 프롬프트를 병렬로 처리하여 평가 및 데이터셋 생성에 최적화되어 있습니다.
웹 및 멀티미디어
음성 인터랙션, 이미지 인식(비전), 이미지 생성 및 브라우저 제어
음성 상호작용
마이크 입력 및 음성 응답 지원. 터미널, Discord 채널 및 메시징 앱에서 사용 가능.
브라우저 자동화
브라우저(로컬/클라우드 Chrome)를 완전히 제어하여 페이지 이동, 폼 채우기, 데이터 추출을 수행합니다.
비전 기능
클립보드에서 스크린샷을 바로 붙여넣어 에이전트가 코드를 분석, 디버깅 또는 설명하도록 합니다.
이미지 생성
FAL.ai를 통해 최상위 생성 모델(FLUX, Ideogram, Recraft)을 통합하여 빠른 자산 생성을 지원합니다.
음성 합성 및 TTS
다중 엔진 음성 합성(텍스트 읽기) 및 음성 메시지 자동 텍스트 변환 지원.
연동 및 커스텀 설정
MCP 서버, IDE 플러그인, 프로바이더 라우팅 및 맞춤형 페르소나
광범위한 연동
MCP 서버 프로토콜, 외부 기억 백엔드, 주요 IDE(VS Code/Zed) 및 OpenAI 호환 API 엔드포인트 지원.
지능형 라우팅
동적 프로바이더 라우팅, 자동 페일오버, 크리덴셜 풀링 및 Claude 프롬프트 캐싱 지원.
페르소나 및 테마
에이전트의 성격을 완벽히 설정 가능(SOUL.md). CLI 커스텀 테마, 로딩 애니메이션 스타일 지원.
확장형 플러그인
코어 코드를 전혀 변경하지 않고 플러그인을 통해 커스텀 도구 및 라이프사이클 훅을 쉽게 추가.
Registries / Providers
memo CLI를 통해 Apple Notes 관리: 생성, 검색, 편집.
백그라운드에서 macOS 데스크톱 제어(스크린샷, 마우스, 키보드, 스크롤, 드래그).
코딩 작업을 Claude Code CLI에 위임(기능 추가, PR 생성).
인포그래픽: 21개 레이아웃 x 21개 스타일.
twozero MCP를 통해 실행 중인 TouchDesigner 인스턴스 제어: 36개 네이티브 도구.
Obsidian 볼트 내의 노트 읽기, 검색, 생성, 편집.
키워드, 저자, 카테고리 또는 ID로 arXiv 논문 검색.
Polymarket 조회: 시장, 가격, 오더북, 이력.
일기 예보를 가져오고 시장 예측을 위해 여러 소스 비교.
이메일을 스캔하고 수신함 요약을 생성하여 매일 Slack에 브리핑 게시.
HTML 생성, 패키지 업로드, VPS로의 SSH 연결을 자동화하여 즉시 웹 배포.
에이전트 실행을 가로채고 도구 호출 전에 사용자 승인 요청.
사용자들이 실제로 구축하고 있는 것
X, Discord, GitHub, Substack에서 수집한 Hermes Agent 커뮤니티의 실제 이야기.
매일 평일 오전 9시에 수신함을 요약하여 Slack에 게시
“나와 함께 성장하는 에이전트. 마케팅성 문구가 아닙니다. 어려운 문제를 해결하면 문자 그대로 markdown 기술 파일을 생성합니다. 자연어 cron 설정: '매일 평일 오전 9시에 수신함을 요약하여 Slack에 게시해줘'.”
나를 구글 검색하고 내 VPS에 랜딩 페이지를 배포하도록 지시
“나에 대해 구글 검색을 한 뒤 찾은 정보를 바탕으로 랜딩 페이지를 만들라고 지시했습니다. 실제로 검색을 수행하고, 링크를 찾고, 페이지를 만들고, 내 VPS에 SSH로 로그인해 업로드한 뒤, 완료되자 문자 메시지를 보냈습니다. 정말 놀라웠습니다.”
자가 학습 날씨 봇으로 48시간 만에 $100 → $216 달성
“자가 학습 날씨 거래 에이전트를 사용하여 48시간 만에 100달러를 216달러로 늘렸습니다. Hermes가 60분마다 날씨 예측 시장을 스캔하고, 위치별 3개 예보 소스를 비교하여 저평가된 기온 옵션을 구매해 이익을 냅니다.”
에이전트가 행동하기 전 생각하도록 'converse-mode' 구축
“내 Hermes 에이전트는 엔터키를 누르는 순간 실행을 시작해서 모호한 생각만 말해도 바로 파일을 썼습니다. 그래서 대화 모드(converse mode)를 만들었습니다. 플러그인 하나, 명령어 두 개. 사용자가 허가하기 전까지는 도구를 건드리지 않습니다.”
몇 분 만에 시작하기
사전 조건 없음. Linux, macOS 및 WSL2에서 동작합니다. 모든 것을 자동으로 설치.
설치
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bashuv, Python 3.11을 설치하고 레지스트리를 클론하여 세팅합니다. sudo 권한은 필요 없습니다.
설정
hermes setuphermes modelNous Portal (OAuth), OpenRouter (API 키) 또는 자체 커스텀 엔드포인트에 연결합니다. 대화형 설정 마법사가 안내합니다.
대화 시작
hermes도구, 메모리, 기술을 갖춘 완벽한 대화형 CLI. 이것만으로 시작할 수 있습니다.
멀티 플랫폼 연동 (선택)
hermes gateway setuphermes gatewayhermes gateway installTelegram, Discord, Slack 또는 WhatsApp으로의 연결 방법을 단계별로 설명합니다. systemd 서비스로 작동합니다.
최신 상태 유지
hermes update최신 변경 사항을 받아오고 종속성을 재설치합니다. 언제든 실행하여 새 기능과 수정 사항을 반영할 수 있습니다.
⚠️ Windows 네이티브 지원은 현재 실험 단계입니다. WSL2를 설치하고 그 안에서 Hermes Agent를 실행하세요.