읽기 포인트
왜 지금 Hermes Model Provider Selection를 봐야 하는지 빠르게 파악
본문에 들어가기 전에 이번 변화가 실무 판단에 어떤 영향을 주는지 먼저 잡아줍니다.
상시 운용은 구독·월 플랜, API는 선별 사용, OAuth 자동화는 신중히 보는 provider 선택 기준
읽기 포인트
왜 지금 Hermes Model Provider Selection를 봐야 하는지 빠르게 파악
본문에 들어가기 전에 이번 변화가 실무 판단에 어떤 영향을 주는지 먼저 잡아줍니다.
추천 활용
바이브코딩 수석 기자 관점에서 읽기
팀 공유나 의사결정 메모로 옮길 때 어떤 문장을 우선 체크할지 안내합니다.
바로 확인할 신호
8분 · #Hermes Agent · #모델 선택
읽는 시간과 대표 태그를 함께 보여줘 후속 기사 탐색까지 자연스럽게 이어집니다.

Hermes나 OpenClaw처럼 파일·로그를 읽는 코딩 에이전트는 일반 채팅처럼 한 번 묻고 끝나지 않습니다. OpenClaw는 Hermes와 비슷하게 장시간 작업 맥락을 다루는 에이전트 계열 도구로 보면 됩니다. 파일을 읽고, 로그를 확인하고, 도구 결과를 다시 입력으로 넣는 과정에서 입력 토큰이 계속 누적됩니다.
그래서 종량제 API를 기본 엔진으로 오래 켜두면 예상보다 비용이 빨리 커질 수 있습니다. 기본값은 성능 순위표 1등이 아니라 비용이 예측 가능한 provider가 되어야 합니다. OpenRouter 같은 API 라우터는 특정 모델 테스트, 특정 로직 검증, 고난도 보조 작업에 선별 사용하는 쪽이 맞습니다.
provider를 먼저 고르지 말고 작업을 먼저 나누면 선택이 단순해집니다.
| 작업 성격 | 권장 provider 유형 | 이유 |
|---|---|---|
| 매일 오래 켜두는 기본 코딩 엔진 | 구독·월 플랜형 | 월 비용과 사용량을 예측하기 쉽습니다. |
| 특정 모델 비교·검증 | 종량제 API | 필요한 순간에만 과금되게 만들 수 있습니다. |
| 민감 자료·반복 초안 | 로컬 모델 | 외부 전송과 API 비용을 줄일 수 있습니다. |
| OAuth 구독 연결 | 개인 실험만 | 계정 정책 경고나 정지 리스크를 확인해야 합니다. |

자주 언급되는 provider는 아래처럼 나눠서 보면 됩니다.
| 분류 | 후보 | 쓸 때 | 제외·주의 이유 |
|---|---|---|---|
| 상시 운용 후보 | OpenAI Codex, Nous Portal, OpenCode Go | 오래 켜둘 기본 코딩 엔진입니다. 특히 월 플랜·구독형은 비용 예측이 쉽습니다. | 조직·개인 계정 정책과 실제 사용량 한도는 먼저 확인합니다. |
| API 선별 사용 후보 | OpenRouter, Z.AI / GLM, Kimi Coding Plan & Moonshot API | 모델 비교, 특정 로직 확정, 고난도 보조 작업에만 씁니다. | 상시 기본으로 두면 입력 토큰 누적으로 월 비용이 빠르게 커질 수 있습니다. |
| 로컬·오픈모델 흐름 | LM Studio, Ollama Cloud | 민감 자료, 반복 초안, 외부 전송 최소화에 씁니다. | 로컬은 성능·환경 설정 부담, 클라우드는 플랜 한도 확인이 필요합니다. |
| OAuth 신중 사용 | Google Gemini via OAuth + Code Assist, Anthropic / Claude Code, Qwen OAuth | 개인 실험과 짧은 테스트에만 둡니다. | 구독 계정을 자동화 backend처럼 쓰는 방식은 경고가 뜰 수 있어 공개 운영에는 비추천입니다. |
Nous Portal, OpenRouter, LM Studio, Anthropic은 선택 화면 상단에 먼저 보이는 항목이라 초반 비교 후보가 되기 쉽습니다. 다만 실제 운영 대화에서는 Codex, OpenCode Go, GLM, Ollama Cloud, Kimi, OpenRouter가 반복해서 언급됩니다. 작성자 환경에서는 OpenAI Codex가 currently active로 표시되어 있었지만, 이는 예시 상태일 뿐 모든 독자가 Codex를 active로 맞춰야 한다는 뜻은 아닙니다.

아래 목록은 Hermes model 선택 화면에 보이는 provider를 빠짐없이 남긴 레퍼런스입니다. 처음부터 전부 외울 필요는 없고, 위 분류를 기준으로 필요한 항목만 보면 됩니다.
| 화면 표시 | 짧은 해석 |
|---|---|
| Nous Portal | Nous Research subscription. 구독형 시작점입니다. |
| OpenRouter | 100+ models, pay-per-use. 여러 모델을 비교하는 종량제 라우터입니다. |
| LM Studio | local desktop app with built-in model server. 로컬 모델 서버입니다. |
| Anthropic | Claude models, API key or Claude Code. Claude 계열 연결입니다. |
| OpenAI Codex | currently active. 코딩 기본 엔진 후보입니다. |
| Xiaomi MiMo | MiMo-V2.5 and V2 models, pro/omni/flash. MiMo 계열 모델입니다. |
| Tencent TokenHub | Hy3 Preview direct API via tokenhub.tencentmaas.com. Hy3 직접 API 경로입니다. |
| NVIDIA NIM | Nemotron models, build.nvidia.com or local NIM. NVIDIA 기반 모델 운영 경로입니다. |
| Qwen OAuth | local Qwen CLI login 재사용. Qwen 로그인 기반 경로입니다. |
| GitHub Copilot | GITHUB_TOKEN 또는 gh auth token 사용. GitHub 개발 흐름과 연결됩니다. |
| GitHub Copilot ACP | copilot --acp --stdio 실행. Copilot ACP 프로세스를 붙이는 방식입니다. |
| Hugging Face Inference Providers | 20+ open models. Hugging Face 모델 생태계 연결입니다. |
| Google AI Studio | Gemini native API. Gemini 공식 API 경로입니다. |
| Google Gemini via OAuth + Code Assist | free tier supported, no API key needed. OAuth 자동화 리스크 확인이 필요합니다. |
| DeepSeek | DeepSeek-V3, R1, coder direct API. reasoning/coding 모델 실험 후보입니다. |
| xAI | Grok models direct API. Grok 계열 실험 후보입니다. |
| Z.AI / GLM | Zhipu AI direct API. GLM 계열 모델 비교 후보입니다. |
| Kimi Coding Plan & Moonshot API | api.kimi.com. 긴 문맥과 코딩 실험 후보입니다. |
| Kimi / Moonshot China | Moonshot CN direct API. 중국 endpoint 경로입니다. |
| StepFun Step Plan | agent/coding models via Step Plan API. StepFun 에이전트·코딩 모델 경로입니다. |
| MiniMax | global direct API. MiniMax 글로벌 API 경로입니다. |
| MiniMax via OAuth browser login | Coding Plan, minimax.io. 브라우저 OAuth 기반 경로입니다. |
| MiniMax China | domestic direct API. MiniMax 중국 domestic endpoint입니다. |
| Alibaba Cloud / DashScope Coding | Qwen + multi-provider. Alibaba Cloud와 Qwen 기반 경로입니다. |
| Ollama Cloud | cloud-hosted open models, ollama.com. Ollama 흐름을 클라우드 모델로 넓히는 선택지입니다. |
| Arcee AI | Trinity models direct API. Arcee Trinity 모델 경로입니다. |
| GMI Cloud | multi-model direct API. 멀티모델 직접 API 후보입니다. |
| Kilo Code | Kilo Gateway API. Kilo Gateway 기반 코딩 모델 경로입니다. |
| OpenCode Zen | 35+ curated models, pay-as-you-go. OpenCode 종량제 모델 묶음입니다. |
| OpenCode Go | open models, $10/month subscription. 비용 예측이 쉬운 월 구독형 후보입니다. |
| AWS Bedrock | Claude, Nova, Llama, DeepSeek, IAM or API key. AWS 운영 기준이 있는 팀 후보입니다. |
| Azure Foundry | OpenAI-style or Anthropic-style endpoint. Azure AI deployment 연결 경로입니다. |
| Vercel AI Gateway | Vercel AI Gateway. Vercel 계정 기반 gateway 경로입니다. |
| Alibaba Cloud Coding Plan | dedicated coding tier. Alibaba Cloud 코딩 전용 tier입니다. |
| custom | direct API. 직접 API 설정입니다. |
| Custom endpoint | enter URL manually. OpenAI 호환 endpoint 등을 수동 입력합니다. |
| Configure auxiliary models | 보조 모델 설정입니다. 요약·검수·특정 작업용 모델을 따로 잡을 때 봅니다. |
| Leave unchanged | 현재 설정을 유지합니다. |
provider를 바꾸기로 결정했다면 model 선택 화면을 다시 열면 됩니다. ChatGPT를 다른 작업에 쓰고 있거나, 기본 provider를 바꿔야 하거나, 특정 provider를 테스트할 때 사용합니다.
PowerShell에서 Docker profile을 쓰는 예시는 다음과 같습니다.
docker run -it --rm -v "$($env:USERPROFILE)\.hermes-bot5:/opt/data" nousresearch/hermes-agent model
macOS/Linux는 같은 명령에서 volume 경로만 ~/.hermes-bot5:/opt/data 형태로 바꾸면 됩니다.
화면에서는 ↑↓로 이동하고 ENTER 또는 SPACE로 선택합니다. ESC는 취소입니다. 모르면 이 명령 자체도 AI에게 “내 환경 기준으로 Hermes model provider 선택 화면 여는 명령 알려줘”라고 물어보면 됩니다.
2026년 5월 10일 오전 1시 49분 커뮤니티 메모의 핵심은 “기록을 하냐 OR 안 하냐”였습니다. provider 선택도 마찬가지입니다. 무엇을 골랐는지보다 왜 골랐고 왜 제외했는지를 남기면 다음 사람이 바로 참고할 수 있는 콘텐츠가 됩니다.
매일 오래 켜둘 기본 코딩 엔진은 비용 예측이 쉬운 구독·월 플랜형 provider를 먼저 봅니다. Codex, Nous Portal, OpenCode Go 같은 후보를 기본 엔진으로 검토하고 API는 보조로 둡니다.
여러 모델 비교, 특정 로직 검증, 고난도 보조 작업, fallback처럼 목적이 분명한 순간에 쓰는 편이 좋습니다. Hermes는 입력 토큰이 계속 누적될 수 있어 API를 상시 기본값으로 두면 비용이 커질 수 있습니다.
연결 자체는 가능해도 구독 계정을 장시간 agent backend처럼 쓰는 방식은 계정 정책 경고나 정지 리스크를 확인해야 합니다. 공개 운영에는 공식 API key나 provider가 명시적으로 허용한 경로가 더 안전합니다.
provider 선택 화면은 길고 바뀔 수 있으므로 전체 목록을 레퍼런스로 남겨두면 다음에 같은 화면을 볼 때 빠르게 비교할 수 있습니다. 다만 판단은 먼저 작업 유형별 기준으로 하는 편이 좋습니다.
PowerShell 기준으로 docker run -it --rm -v "$($env:USERPROFILE)\.hermes-bot5:/opt/data" nousresearch/hermes-agent model 명령을 실행하면 됩니다.
다음 읽기
Hermes Codex App-Server Runtime은 단순한 모델 변경 기능이 아닙니다. Hermes가 OpenAI Codex의 실행 환경을 빌려 쓰는 구조입니다. 즉 Hermes가 모든 도구 호출을 직접 처리하는 대신, OpenAI Codex app-server에게 shell, 파일 수정, sandbox, apply_patch, MCP, Codex 플러그인 호출을 맡깁니다.
이때 Hermes는 사라지지 않습니다. Hermes는 세션 DB, slash command, gateway, memory review, skill review, 브라우저 자동화, 이미지·비전·TTS 같은 상위 도구 레이어를 유지합니다. 구조를 한 문장으로 줄이면 다음입니다.
Cloudflare R2는 AWS S3와 비슷한 객체 스토리지이면서 인터넷 egress 비용이 없는 것이 강점입니다. 이 글은 R2를 헤르메스…