실시간 음성 AI를 900만 명 규모로 — OpenAI의 저지연 인프라 설계

ChatGPT에서 실시간 음성 대화를 해본 적이 있다면, 그 응답 속도가 얼마나 많은 공학적 고민의 결과인지 체감하기 쉽지 않다. OpenAI가 이번 주 저지연 음성 AI를 대규모로 운영하는 방법을 상세히 공개했다. 이미지 출처: Unsplash 핵심 결정은 전통적인 SFU(Selective Forwarding Unit) 방식을 버리고 WebRTC 직접 트랜시버 연결을 택한 것이다. 기존 음성·영상 통화 인프라는 대부분 중간 서버가 미디어 스트림을 … 더 읽기