주요 LLM 모델들의 가격 표

Category: Generative AI
Donghyuk Kim

주요 생성형 AI 모델 API 가격 변화 (2020년 ~ 현재) - DeepSeek 포함 업데이트

모델명 (회사) 주요 시점 입력 가격 ($/1M 토큰) 출력 가격 ($/1M 토큰) 비고
GPT-3 Davinci (OpenAI) 2020년 중반 출시 ~$20.00 ~$20.00 초기 주력 모델, 이후 버전별 가격 다양화
GPT-3.5 Turbo (OpenAI) 2023년 2월 출시 $2.00 $2.00 초기 가격, 이후 여러 차례 인하
2023년 11월 $1.00 $2.00 gpt-3.5-turbo-1106 기준 가격 인하
2024년 1월 $0.50 $1.50 gpt-3.5-turbo-0125 기준 가격 인하 (현재 주요 가격)
GPT-4 (OpenAI) 2023년 3월 출시 $30.00 $60.00 8k 컨텍스트 기준 초기 가격
GPT-4 Turbo (OpenAI) 2023년 11월 프리뷰 $10.00 $30.00 GPT-4 대비 가격 인하 및 성능 향상
GPT-4o (OpenAI) 2024년 5월 출시 $5.00 $15.00 GPT-4 Turbo 대비 대폭 가격 인하, 멀티모달 지원 강화
PaLM 2 (Google) 2023년 5월 출시 ~$0.50 ~$0.50 초기 모델 (당시 문자 기반 가격 책정 후 토큰 기반으로 변경되는 경향)
Gemini 1.0 Pro (Google) 2023년 12월 출시 $0.50 $1.50 GPT-3.5 Turbo와 유사한 가격대로 책정 (초기 및 안정화 가격)
Gemini 1.5 Pro (Google) 2024년 4월 3.503.50 - 7.00 10.5010.50 - 21.00 컨텍스트 길이에 따라 가격 변동 (128k 이하 / 초과)
Gemini 1.5 Flash (Google) 2024년 5월 출시 0.350.35 - 0.70 1.051.05 - 2.10 경량화 버전, 컨텍스트 길이에 따라 가격 변동 (128k 이하 / 초과)
Claude Instant (Anthropic) 2023년 초 $0.80 $2.40 초기 경량 모델 (Claude 1.2 기준 추정)
Claude 2.1 (Anthropic) 2023년 11월 $8.00 $24.00 대규모 컨텍스트 지원 모델
Claude 3 Haiku (Anthropic) 2024년 3월 출시 $0.25 $1.25 Claude 3 제품군 중 가장 빠르고 저렴한 모델
Claude 3 Sonnet (Anthropic) 2024년 3월 출시 $3.00 $15.00 성능과 비용의 균형을 맞춘 모델
Claude 3 Opus (Anthropic) 2024년 3월 출시 $15.00 $75.00 Claude 3 제품군 중 가장 강력한 모델
Llama 2 (Meta) 2023년 7월 출시 무료 (오픈소스) 무료 (오픈소스) 모델 자체는 무료, 호스팅/API 사용 시 비용 발생 (클라우드 업체별 상이)
Llama 3 (Meta) 2024년 4월 출시 무료 (오픈소스) 무료 (오픈소스) 모델 자체는 무료, 호스팅/API 사용 시 비용 발생 (클라우드 업체별 상이)
Mistral 7B (Mistral AI) 2023년 9월 출시 무료 (오픈소스) 무료 (오픈소스) 모델 자체는 무료, API 사용 시 비용 발생 (Mistral AI 플랫폼 또는 클라우드)
Mixtral 8x7B (Mistral AI) 2023년 12월 출시 무료 (오픈소스) 무료 (오픈소스) 모델 자체는 무료, API 사용 시 비용 발생 (Mistral AI 플랫폼 또는 클라우드)
Mistral Small (Mistral AI) 2024년 초 $2.00 $6.00 (현재 mistral-small-latest) 초기 가격대
Mistral Large (Mistral AI) 2024년 2월 출시 $8.00 $24.00 Mistral AI의 고성능 모델 (초기 가격, mistral-large-latest)
Mistral Next (Mistral AI) 2024년 4월 출시 $3.00 $9.00 Mistral의 중간급 최신 모델
Qwen-Turbo (Alibaba Cloud) 2023년 중반 이후 ~$0.80 ~$1.10 (구체적 버전 따라 상이) 가성비 모델, 종량제 기준 추정치
Qwen-Plus (Alibaba Cloud) 2023년 중반 이후 ~$2.80 ~$2.80 (구체적 버전 따라 상이) 표준 모델, 종량제 기준 추정치
Qwen-Max (Alibaba Cloud) 2023년 중반 이후 ~$16.80 ~$16.80 (구체적 버전 따라 상이) 고성능 모델, 종량제 기준 추정치
Qwen-Long (Alibaba Cloud) 2024년 초 ~$0.70 ~$1.40 긴 컨텍스트 처리 모델, 종량제 기준 추정치
DeepSeek-V2 (DeepSeek AI) 2024년 5월 출시 ~$0.14 ~$0.28 매우 저렴한 가격. (¥1 입력 / ¥2 출력 @ 백만 토큰 기준, USD 환산 추정치)