제미나이
Google DeepMind가 개발한 멀티모달 AI 모델 시리즈로, 텍스트·이미지·오디오·비디오·코드를 통합적으로 처리할 수 있는 것이 가장 큰 차별점이다. 다른 모델이 주로 텍스트 기반으로 동작하는 반면, Gemini는 스크린샷을 보고 UI 코드를 생성하거나, 다이어그램을 이해하고 관련 코드를 작성하는 등 시각적 입력을 코딩에 활용할 수 있다. Gemini 2.0 Flash(빠르고 저렴), Gemini Pro(고성능) 등 다양한 변형이 있으며, 용도에 따라 선택할 수 있다. Gemini Code Assist(IDE 기반 코딩 도구)와 Gemini CLI(터미널 에이전트)를 통해 코딩을 지원하며, Google Cloud 생태계(Cloud Functions, Firebase, BigQuery, Vertex AI 등)와 긴밀하게 통합되어 있어 Google Cloud 사용자에게 특히 유리하다. Google의 방대한 데이터와 인프라를 기반으로 하므로, 정보 검색 능력(Grounding with Google Search)이 뛰어나 최신 라이브러리나 API 정보를 반영한 코드 생성에 강점이 있다.
예시
Gemini CLI에서 코드와 스크린샷을 함께 제공하며 '이 UI 버그를 수정해줘'라고 요청.
참고
Gemini 2.0 Flash, Gemini Pro 등 다양한 변형. Google Cloud 생태계와 긴밀 통합.
카테고리
AI 모델·프로바이더
난이도
basic
태그
제미나이 · Google
함께 읽기
연관 용어
CLI·터미널 도구
제미나이 CLI
Google이 오픈소스로 공개한 AI 에이전트 CLI 도구로, 터미널에서 코드 이해, 파일 조작, 명령어 실행, 대규모 코드베이스 편집을 지원한다. Google의 Gemini 모델을 기반으로 하며, Gemini의 멀티모달 능력을 활용하여 텍스트뿐 아니라 이미지와 비디오 생성까지 가능하다는 것이 독특한 차별점이다. 예를 들어, '이 UI의 스크린샷을 보고 React 컴포넌트를 만들어줘'와 같은 시각적 입력 기반 코딩이 가능하다. 오픈소스 프로젝트로 커뮤니티 기여가 가능하며, Google Cloud 생태계(Cloud Functions, Firebase, Vertex AI 등)와 긴밀하게 통합된다. Gemini Code Assist(IDE 기반 도구)와도 연동되어, CLI에서 시작한 작업을 IDE에서 이어서 할 수 있다. Claude Code, Codex CLI와 함께 3대 CLI 코딩 에이전트를 형성하며, Google 계정만 있으면 무료로 사용할 수 있어 진입 장벽이 낮다.
AI 모델·프로바이더
대규모 언어 모델
방대한 텍스트 데이터(인터넷의 글, 코드, 책 등)로 훈련되어 인간 언어를 이해·생성·조작할 수 있는 대규모 신경망(neural network)이다. 바이브 코딩의 핵심 엔진으로, 자연어 지시를 이해하고 이를 프로그래밍 코드로 변환하는 능력이 바이브 코딩을 가능하게 하는 근본 기술이다. GPT-4(OpenAI), Claude Opus 4.6(Anthropic), Gemini(Google), DeepSeek(DeepSeek AI) 등이 대표적이며, 각 모델은 코드 생성 능력, 추론 깊이, 컨텍스트 윈도우 크기, 응답 속도, 비용에서 서로 다른 특성을 보인다. LLM을 이해하는 핵심 개념으로는 토큰(텍스트 처리 기본 단위), 컨텍스트 윈도우(한 번에 처리할 수 있는 텍스트 길이), 파라미터 수(모델의 크기/복잡도), 파인튜닝(특정 작업에 맞게 추가 훈련) 등이 있다. AI 코딩 능력을 측정하는 주요 벤치마크로는 SWE-bench(실제 GitHub 이슈 해결), Terminal Bench(터미널 에이전트 능력), HumanEval(함수 생성 능력) 등이 있다. LLM은 확률적으로 '가장 그럴듯한 다음 토큰'을 예측하는 방식으로 동작하며, 이 때문에 환각(Hallucination)이 발생할 수 있다.
AI 모델·프로바이더
클로드
Anthropic이 개발한 AI 모델 시리즈로, 안전성(safety), 정직성(honesty), 유용성(helpfulness)을 핵심 원칙으로 설계되었다. 바이브 코딩에서 가장 널리 사용되는 모델 중 하나이며, 깊은 코드 이해, 상세한 설명 생성, 100만 토큰의 업계 최대급 컨텍스트 윈도우가 주요 강점이다. 현재 Claude 4 패밀리로 구성되어 있으며, Claude Opus 4.6(가장 강력한 최상위 모델), Claude Opus 4.5, Claude Opus 4.1, Claude Opus 4, Claude Sonnet 4의 다섯 가지 모델이 있다. Opus 계열은 복잡한 추론과 대규모 코드 분석에, Sonnet 계열은 빠른 응답과 비용 효율에 최적화되어 있다. Claude Code(CLI 도구)를 통해 터미널에서 직접 사용하거나, Cursor·Windsurf 등 제3자 IDE에서 모델로 선택할 수 있다. API 모델 문자열은 'claude-opus-4-6'이며, 웹·모바일·데스크톱 채팅 인터페이스를 통해서도 접근 가능하다. Constitutional AI라는 독자적인 안전 기술로 유해한 출력을 최소화하면서도 유용한 코드 생성을 유지하는 것이 특징이다.