본문 바로가기
release

OpenAI, 듣고 추론하고 도구 호출까지 하는 API용 실시간 음성 모델 3종 공개

(올해)
  • GPT-Realtime-2 - 실시간 음성 대화용 모델. GPT-5급 추론 능력을 가진 음성 에이전트
  • GPT-Realtime-Translate - 70개 이상 입력 언어, 13개 출력 언어로 실시간 음성 번역하는 모델
  • GPT-Realtime-Whisper - 실시간 음성-텍스트 변환 모델. 사용자가 말하는 동안 바로 전사하기 때문에 각종 자막, 회의, 대화 기록에 적합

세 모델 모두 Realtime API 에서 사용할 수 있음. 이제 음성 AI 가 단순히 대화를 도와주는 게 아니라 음성으로 업무를 처리하는 에이전트 인터페이스가 됨.

관련 항목

관련 링크