AI 뉴스 브리핑

Hermes AI 모델 Provider 선택 가이드 | AI 엔진 공급자 비용 비교 2026

AI 뉴스 브리핑

Hermes AI 모델 Provider 선택 가이드 | AI 엔진 공급자 비용 비교 2026

상시 운용은 구독·월 플랜, API는 선별 사용, OAuth 자동화는 신중히 보는 provider 선택 기준

콘텐츠 형식: AI 뉴스 브리핑
핵심 주제: Hermes Model Provider Selection
추천 독자: 바이브코딩 수석 기자
발행일: 2026.05.09
읽기 시간: 8분
작성: 윤슬 코드

다른 뉴스 더 보기 심층 학습 가이드 보기

한눈에 읽는 본문

읽기 포인트

왜 지금 Hermes Model Provider Selection를 봐야 하는지 빠르게 파악

본문에 들어가기 전에 이번 변화가 실무 판단에 어떤 영향을 주는지 먼저 잡아줍니다.

왜 provider 선택이 모델 비교가 아닌가

Hermes provider 선택을 상시 운용, 모델 테스트, 로컬 초안, OAuth 실험으로 나누는 판단표 — Provider 선택은 모델 이름 비교가 아니라 **상시 운용 비용, 테스트 목적, 로컬 처리, OAuth 위험**을 나누는 판단입니다.

Hermes나 OpenClaw처럼 파일·로그를 읽는 코딩 에이전트는 일반 채팅처럼 한 번 묻고 끝나지 않습니다. OpenClaw는 Hermes와 비슷하게 장시간 작업 맥락을 다루는 에이전트 계열 도구로 보면 됩니다. 파일을 읽고, 로그를 확인하고, 도구 결과를 다시 입력으로 넣는 과정에서 입력 토큰이 계속 누적됩니다.

그래서 종량제 API를 기본 엔진으로 오래 켜두면 예상보다 비용이 빨리 커질 수 있습니다. 기본값은 성능 순위표 1등이 아니라 비용이 예측 가능한 provider가 되어야 합니다. OpenRouter 같은 API 라우터는 특정 모델 테스트, 특정 로직 검증, 고난도 보조 작업에 선별 사용하는 쪽이 맞습니다.

작업 유형별 선택 기준

provider를 먼저 고르지 말고 작업을 먼저 나누면 선택이 단순해집니다.

작업 성격	권장 provider 유형	이유
매일 오래 켜두는 기본 코딩 엔진	구독·월 플랜형	월 비용과 사용량을 예측하기 쉽습니다.
특정 모델 비교·검증	종량제 API	필요한 순간에만 과금되게 만들 수 있습니다.
민감 자료·반복 초안	로컬 모델	외부 전송과 API 비용을 줄일 수 있습니다.
OAuth 구독 연결	개인 실험만	계정 정책 경고나 정지 리스크를 확인해야 합니다.

분류별 추천 provider

구독형 월 플랜을 기본 엔진으로 두고 종량제 API와 로컬 모델을 선별 사용하도록 나누는 비용 라우팅 그림 — 상시 엔진은 비용 예측이 쉬운 쪽에 두고, **종량제 API는 모델 테스트와 확정 작업에만 선별 사용**하는 편이 안전합니다.

자주 언급되는 provider는 아래처럼 나눠서 보면 됩니다.

분류	후보	쓸 때	제외·주의 이유
상시 운용 후보	OpenAI Codex, Nous Portal, OpenCode Go	오래 켜둘 기본 코딩 엔진입니다. 특히 월 플랜·구독형은 비용 예측이 쉽습니다.	조직·개인 계정 정책과 실제 사용량 한도는 먼저 확인합니다.
API 선별 사용 후보	OpenRouter, Z.AI / GLM, Kimi Coding Plan & Moonshot API	모델 비교, 특정 로직 확정, 고난도 보조 작업에만 씁니다.	상시 기본으로 두면 입력 토큰 누적으로 월 비용이 빠르게 커질 수 있습니다.
로컬·오픈모델 흐름	LM Studio, Ollama Cloud	민감 자료, 반복 초안, 외부 전송 최소화에 씁니다.	로컬은 성능·환경 설정 부담, 클라우드는 플랜 한도 확인이 필요합니다.
OAuth 신중 사용	Google Gemini via OAuth + Code Assist, Anthropic / Claude Code, Qwen OAuth	개인 실험과 짧은 테스트에만 둡니다.	구독 계정을 자동화 backend처럼 쓰는 방식은 경고가 뜰 수 있어 공개 운영에는 비추천입니다.

Nous Portal, OpenRouter, LM Studio, Anthropic은 선택 화면 상단에 먼저 보이는 항목이라 초반 비교 후보가 되기 쉽습니다. 다만 실제 운영 대화에서는 Codex, OpenCode Go, GLM, Ollama Cloud, Kimi, OpenRouter가 반복해서 언급됩니다. 작성자 환경에서는 OpenAI Codex가 currently active로 표시되어 있었지만, 이는 예시 상태일 뿐 모든 독자가 Codex를 active로 맞춰야 한다는 뜻은 아닙니다.

전체 provider 목록

OpenAI Codex, OpenCode Go, OpenRouter, GLM, Kimi, LM Studio, Ollama Cloud 등 provider를 분류한 레퍼런스 보드 — 긴 provider 목록은 처음부터 외우는 표가 아니라 **필요할 때 찾아보는 레퍼런스**로 두는 것이 읽기 쉽습니다.

아래 목록은 Hermes model 선택 화면에 보이는 provider를 빠짐없이 남긴 레퍼런스입니다. 처음부터 전부 외울 필요는 없고, 위 분류를 기준으로 필요한 항목만 보면 됩니다.

화면 표시	짧은 해석
Nous Portal	Nous Research subscription. 구독형 시작점입니다.
OpenRouter	100+ models, pay-per-use. 여러 모델을 비교하는 종량제 라우터입니다.
LM Studio	local desktop app with built-in model server. 로컬 모델 서버입니다.
Anthropic	Claude models, API key or Claude Code. Claude 계열 연결입니다.
OpenAI Codex	currently active. 코딩 기본 엔진 후보입니다.
Xiaomi MiMo	MiMo-V2.5 and V2 models, pro/omni/flash. MiMo 계열 모델입니다.
Tencent TokenHub	Hy3 Preview direct API via tokenhub.tencentmaas.com. Hy3 직접 API 경로입니다.
NVIDIA NIM	Nemotron models, build.nvidia.com or local NIM. NVIDIA 기반 모델 운영 경로입니다.
Qwen OAuth	local Qwen CLI login 재사용. Qwen 로그인 기반 경로입니다.
GitHub Copilot	GITHUB_TOKEN 또는 gh auth token 사용. GitHub 개발 흐름과 연결됩니다.
GitHub Copilot ACP	copilot --acp --stdio 실행. Copilot ACP 프로세스를 붙이는 방식입니다.
Hugging Face Inference Providers	20+ open models. Hugging Face 모델 생태계 연결입니다.
Google AI Studio	Gemini native API. Gemini 공식 API 경로입니다.
Google Gemini via OAuth + Code Assist	free tier supported, no API key needed. OAuth 자동화 리스크 확인이 필요합니다.
DeepSeek	DeepSeek-V3, R1, coder direct API. reasoning/coding 모델 실험 후보입니다.
xAI	Grok models direct API. Grok 계열 실험 후보입니다.
Z.AI / GLM	Zhipu AI direct API. GLM 계열 모델 비교 후보입니다.
Kimi Coding Plan & Moonshot API	api.kimi.com. 긴 문맥과 코딩 실험 후보입니다.
Kimi / Moonshot China	Moonshot CN direct API. 중국 endpoint 경로입니다.
StepFun Step Plan	agent/coding models via Step Plan API. StepFun 에이전트·코딩 모델 경로입니다.
MiniMax	global direct API. MiniMax 글로벌 API 경로입니다.
MiniMax via OAuth browser login	Coding Plan, minimax.io. 브라우저 OAuth 기반 경로입니다.
MiniMax China	domestic direct API. MiniMax 중국 domestic endpoint입니다.
Alibaba Cloud / DashScope Coding	Qwen + multi-provider. Alibaba Cloud와 Qwen 기반 경로입니다.
Ollama Cloud	cloud-hosted open models, ollama.com. Ollama 흐름을 클라우드 모델로 넓히는 선택지입니다.
Arcee AI	Trinity models direct API. Arcee Trinity 모델 경로입니다.
GMI Cloud	multi-model direct API. 멀티모델 직접 API 후보입니다.
Kilo Code	Kilo Gateway API. Kilo Gateway 기반 코딩 모델 경로입니다.
OpenCode Zen	35+ curated models, pay-as-you-go. OpenCode 종량제 모델 묶음입니다.
OpenCode Go	open models, $10/month subscription. 비용 예측이 쉬운 월 구독형 후보입니다.
AWS Bedrock	Claude, Nova, Llama, DeepSeek, IAM or API key. AWS 운영 기준이 있는 팀 후보입니다.
Azure Foundry	OpenAI-style or Anthropic-style endpoint. Azure AI deployment 연결 경로입니다.
Vercel AI Gateway	Vercel AI Gateway. Vercel 계정 기반 gateway 경로입니다.
Alibaba Cloud Coding Plan	dedicated coding tier. Alibaba Cloud 코딩 전용 tier입니다.
custom	direct API. 직접 API 설정입니다.
Custom endpoint	enter URL manually. OpenAI 호환 endpoint 등을 수동 입력합니다.
Configure auxiliary models	보조 모델 설정입니다. 요약·검수·특정 작업용 모델을 따로 잡을 때 봅니다.
Leave unchanged	현재 설정을 유지합니다.

실행 방법

provider를 바꾸기로 결정했다면 model 선택 화면을 다시 열면 됩니다. ChatGPT를 다른 작업에 쓰고 있거나, 기본 provider를 바꿔야 하거나, 특정 provider를 테스트할 때 사용합니다.

PowerShell에서 Docker profile을 쓰는 예시는 다음과 같습니다.

docker run -it --rm -v "$($env:USERPROFILE)\.hermes-bot5:/opt/data" nousresearch/hermes-agent model

macOS/Linux는 같은 명령에서 volume 경로만 ~/.hermes-bot5:/opt/data 형태로 바꾸면 됩니다.

화면에서는 ↑↓로 이동하고 ENTER 또는 SPACE로 선택합니다. ESC는 취소입니다. 모르면 이 명령 자체도 AI에게 “내 환경 기준으로 Hermes model provider 선택 화면 여는 명령 알려줘”라고 물어보면 됩니다.

최종 체크리스트

기본 엔진이 구독·월 플랜형 또는 비용 예측 가능한 provider인가?
월 비용 상한과 fallback 기준을 정했는가?
OpenRouter, GLM, Kimi 같은 API를 쓰는 목적이 명확한가?
Google Gemini OAuth, Claude Code OAuth 같은 구독 계정 자동화 리스크를 확인했는가?
선택한 이유와 제외한 이유를 짧게 기록했는가?

참고 링크

Hermes Agent AI Providers: https://hermes-agent.nousresearch.com/docs/integrations/providers
Hermes Agent Configuration: https://hermes-agent.nousresearch.com/docs/user-guide/configuration
OpenRouter Quickstart: https://openrouter.ai/docs/quickstart
LM Studio Developer Docs: https://lmstudio.ai/docs/app/api
OpenAI Codex 문서: https://developers.openai.com/codex/

작성 메모

2026년 5월 10일 오전 1시 49분 커뮤니티 메모의 핵심은 “기록을 하냐 OR 안 하냐”였습니다. provider 선택도 마찬가지입니다. 무엇을 골랐는지보다 왜 골랐고 왜 제외했는지를 남기면 다음 사람이 바로 참고할 수 있는 콘텐츠가 됩니다.

자주 묻는 질문

처음에는 어떤 provider를 기본값으로 두는 게 좋나요?

매일 오래 켜둘 기본 코딩 엔진은 비용 예측이 쉬운 구독·월 플랜형 provider를 먼저 봅니다. Codex, Nous Portal, OpenCode Go 같은 후보를 기본 엔진으로 검토하고 API는 보조로 둡니다.

OpenRouter 같은 API는 언제 쓰는 게 좋나요?

여러 모델 비교, 특정 로직 검증, 고난도 보조 작업, fallback처럼 목적이 분명한 순간에 쓰는 편이 좋습니다. Hermes는 입력 토큰이 계속 누적될 수 있어 API를 상시 기본값으로 두면 비용이 커질 수 있습니다.

Google Gemini나 Claude Code OAuth 연결은 왜 조심해야 하나요?

연결 자체는 가능해도 구독 계정을 장시간 agent backend처럼 쓰는 방식은 계정 정책 경고나 정지 리스크를 확인해야 합니다. 공개 운영에는 공식 API key나 provider가 명시적으로 허용한 경로가 더 안전합니다.

전체 provider 목록은 왜 남기나요?

provider 선택 화면은 길고 바뀔 수 있으므로 전체 목록을 레퍼런스로 남겨두면 다음에 같은 화면을 볼 때 빠르게 비교할 수 있습니다. 다만 판단은 먼저 작업 유형별 기준으로 하는 편이 좋습니다.

모델 선택 화면은 어떻게 다시 여나요?

PowerShell 기준으로 docker run -it --rm -v "$($env:USERPROFILE)\.hermes-bot5:/opt/data" nousresearch/hermes-agent model 명령을 실행하면 됩니다.

다음 읽기

이 기사와 함께 보면 좋은 콘텐츠

편집부·Hermes Codex App-Server Runtime·2026.05.15·16분 읽기

Hermes Codex Runtime 연동 | ChatGPT 구독형 A…

핵심 판단 - Codex가 실행 인프라가 되는 순간

Hermes Codex App-Server Runtime은 단순한 모델 변경 기능이 아닙니다. Hermes가 OpenAI Codex의 실행 환경을 빌려 쓰는 구조입니다. 즉 Hermes가 모든 도구 호출을 직접 처리하는 대신, OpenAI Codex app-server에게 shell, 파일 수정, sandbox, apply_patch, MCP, Codex 플러그인 호출을 맡깁니다.

이때 Hermes는 사라지지 않습니다. Hermes는 세션 DB, slash command, gateway, memory review, skill review, 브라우저 자동화, 이미지·비전·TTS 같은 상위 도구 레이어를 유지합니다. 구조를 한 문장으로 줄이면 다음입니다.

#Hermes Agent#OpenAI Codex#Codex Runtime

요약맥락

편집부·Cloudflare R2 파일·이미지 서버 가이드·2026.04.26·135분 읽기

Cloudflare R2 이미지 서버 구축 가이드 | S3 대안 무료…

Cloudflare R2는 AWS S3와 비슷한 객체 스토리지이면서 인터넷 egress 비용이 없는 것이 강점입니다. 이 글은 R2를 헤르메스…

#Cloudflare R2#파일 서버#이미지 서버

요약맥락