release
OpenAI, 듣고 추론하고 도구 호출까지 하는 API용 실시간 음성 모델 3종 공개
(올해)
- GPT-Realtime-2 - 실시간 음성 대화용 모델. GPT-5급 추론 능력을 가진 음성 에이전트
- GPT-Realtime-Translate - 70개 이상 입력 언어, 13개 출력 언어로 실시간 음성 번역하는 모델
- GPT-Realtime-Whisper - 실시간 음성-텍스트 변환 모델. 사용자가 말하는 동안 바로 전사하기 때문에 각종 자막, 회의, 대화 기록에 적합
세 모델 모두 Realtime API 에서 사용할 수 있음. 이제 음성 AI 가 단순히 대화를 도와주는 게 아니라 음성으로 업무를 처리하는 에이전트 인터페이스가 됨.