Hermes Ollama 무료 로컬 AI 에이전트 설치부터 실전 활용까지 완전 가이드

Hermes는 단순한 AI 챗봇이 아닙니다. 메모리, 자동화 스케줄, 서브에이전트 위임까지 갖춘 자율 AI 에이전트이며, 오픈소스 도구인 Ollama를 통해 완전 무료로 설치할 수 있습니다. ZDNet 기고자 Jack Wallen이 수십 개의 AI 데스크탑 앱을 테스트한 끝에 현재 가장 선호하는 도구로 꼽은 것이 바로 이 조합입니다.

클라우드 기반 AI 서비스가 넘쳐나는 지금, 굳이 로컬 AI를 선택하는 이유가 있습니다. 전력망 부담을 줄이고, 내 데이터가 외부 서버로 전송되지 않으며, 비용이 들지 않습니다. 이 글에서는 Hermes가 무엇인지, 어떻게 설치하는지, 실제로 어떤 방식으로 활용하는지를 순서대로 정리합니다.

사용기 원문보기

Hermes 에이전트란 무엇인가

Hermes는 “자기 개선형 개인 에이전트”로 설명됩니다. 공식 설명에 따르면 Hermes는 학습한 내용을 기억하고, 반복 실행 가능한 스킬을 생성하며, 스케줄 자동화를 실행하고, 서브에이전트에 작업을 위임하며, Docker, SSH, Modal 등 다양한 샌드박스 환경에서 작동합니다.

Hermes 에이전트는 다섯 가지 핵심 요소로 구성됩니다.

메모리(Memory): 향후 작업에 활용할 정보를 저장합니다.

스킬(Skills): 반복 가능한 행동을 정의하는 플레이북입니다.

소울(Soul): 에이전트의 말투, 스타일, 기본 행동 방식을 결정합니다.

크론(Crons): 스케줄 자동화입니다. 예를 들어 매일 아침 Slack 스레드를 요약하도록 설정할 수 있습니다.

세션 회상(Session Recall): 이전 대화, 링크, 결정, 프로젝트를 검색할 수 있는 기록 저장소입니다.

이 다섯 요소가 결합되면, Hermes는 메시지를 읽고 적절한 도구를 선택하며 스킬을 호출하고 메모리를 업데이트한 뒤 다음 행동을 스스로 결정하는 추론 루프를 실행합니다.

Hermes와 Ollama 설치 방법

Hermes는 공식 인스톨러와 Ollama 두 가지 방식으로 설치할 수 있습니다. Ollama를 통한 설치가 훨씬 간단하며 무료 모델 사용이 가능합니다.

Linux에서 Ollama 설치

터미널을 열고 아래 명령어를 실행합니다.

curl -fsSL https://ollama.com/install.sh | sh

설치 후 Ollama 서비스를 시작합니다.

sudo systemctl start ollama

macOS에서 Ollama 설치

터미널 앱에서 동일한 명령어를 실행합니다.

curl -fsSL https://ollama.com/install.sh | sh

Windows에서 Ollama 설치

PowerShell에서 아래 명령어를 실행합니다.

irm https://ollama.com/install.ps1 | iex

Hermes 실행

세 운영체제 모두 아래 명령어로 Hermes를 실행합니다.

ollama launch hermes-desktop

실행하면 모델 선택 창이 열립니다. 초기 선택 이후에도 설정에서 언제든지 모델을 변경할 수 있습니다.

모델 추가 및 변경 방법

Hermes GUI가 열린 뒤 모델을 변경하려면 창 오른쪽 상단의 톱니바퀴 아이콘을 클릭합니다. 설정 페이지에서 원하는 모델을 선택합니다. Google Gemini(OAuth 방식), Qwen Code 등 다양한 모델을 선택할 수 있습니다.

모델 선택 후 “Set Up” 링크를 클릭해 온보딩 과정을 완료하면 해당 모델로 전환됩니다.

실전 활용 사례

Jack Wallen이 실제로 테스트한 쿼리는 다음과 같습니다.

“내 바이닐 앨범 인벤토리를 관리하는 앱을 만들어줘.”

Hermes는 곧바로 작업을 시작하지 않고 먼저 어떤 종류의 앱을 원하는지 질문했습니다. 데스크탑 앱 또는 웹 앱, 어떤 언어 기반으로 만들지, 어떤 기능이 필수인지를 순서대로 확인한 뒤 실제 코드 작성에 들어갔습니다. 작업 진행 중에는 각 단계별 소요 시간이 실시간으로 표시됩니다.

이 방식은 단순히 코드를 뱉는 것과 다릅니다. 세션 시간이 기록되고, 이전 세션으로 돌아가 이어서 작업할 수 있으며, 각 세션에서 생성된 파일을 아티팩트로 관리할 수 있습니다.

Hermes가 유용한 상황과 한계

Hermes가 특히 강점을 보이는 상황은 다음과 같습니다.

반복 자동화가 필요한 경우입니다. 매일 아침 Slack 스레드 요약, 정기 리포트 생성 같은 크론 기반 작업에 적합합니다.

여러 대화를 동시에 관리할 때입니다. 프로젝트별로 채팅을 고정해두고 맥락을 유지한 채 병렬로 진행할 수 있습니다.

로컬 환경에서 코드를 작성하고 실행할 때입니다. Docker, SSH, Singularity 등 다양한 실행 환경을 지원합니다.

반면 한계도 명확합니다. 모델 선택에 따라 품질 차이가 크며, 일부 환경별 설치 문제는 Hermes가 직접 해결하지 못하는 경우가 있습니다. Wallen의 테스트에서도 PyQt5 설치 명령어를 잘못 제안하는 사례가 있었습니다. 쿼리 할당량 제한도 존재합니다.

로컬 AI를 선택해야 하는 이유

클라우드 AI와 로컬 AI의 차이는 단순히 비용 문제가 아닙니다. 로컬 AI는 입력한 내용이 외부 서버로 전송되지 않으므로 민감한 업무 데이터나 개인 정보를 다룰 때 근본적으로 안전합니다. 전력 소비 측면에서도 데이터센터를 거치지 않으므로 에너지 효율이 높습니다.

Hermes와 Ollama 조합은 현재 무료로 사용할 수 있는 로컬 AI 에이전트 중 가장 완성도 높은 옵션 중 하나입니다. 단순 챗봇 수준을 넘어 자동화, 메모리, 멀티 에이전트 위임까지 지원한다는 점에서 일반 사용자부터 개발자까지 폭넓게 활용할 수 있습니다.

처음 설치에 약간의 터미널 사용이 필요하지만, 한 번 구축해두면 유지 비용 없이 지속적으로 활용할 수 있는 환경이 만들어집니다.

#Hermes #Ollama #로컬AI #AI에이전트 #무료AI #오픈소스AI