몇 달 전 OpenAI에서 GPT-4o의 음성 데모를 기억하시나요? 인간과 비슷해서 세상을 뒤흔든 적이 있죠. 잠깐 AI와 대화하고 있다는 걸 잊게 만들고, 많은 사람에게 영화 Her에서 스칼렛 요한슨이 연기한 AI 캐릭터를 떠올리게 했던 그 데모 말입니다(그리고 같은 이유로 비판을 받기도 했습니다).
OpenAI는 마침내 소수의 ChatGPT Plus 사용자에게 알파로 출시를 시작했습니다. 이 회사는 X에서 공유했습니다. 이 회사는 원래 6월에 출시를 시작할 계획이었지만 안전상의 이유와 “[OpenAI의] 출시 기준을 충족”할 수 있도록 연기되었습니다. 그래서 이 회사는 외부 레드팀 팀과 함께 모델을 개선하는 데 바빴고, 특정 콘텐츠를 감지하고 거부할 수 있었습니다.
소규모 ChatGPT Plus 사용자에게 고급 음성 모드를 출시하기 시작했습니다. 고급 음성 모드는 보다 자연스럽고 실시간 대화를 제공하고, 언제든지 방해할 수 있으며, 감정을 감지하고 반응합니다. pic.twitter.com/64O94EhhXK
— OpenAI(@OpenAI) 2024년 7월 30일
이제 일부 유료 사용자는 ChatGPT 앱에서 모델에 액세스하기 시작했지만 지금은 알파 버전에 대한 액세스가 작을 것입니다. 이 회사는 점차적으로 더 많은 사용자에게 액세스를 제공하고 가을에 모든 유료 사용자에게 제공할 계획이라고 말합니다.
고급 음성 모드에 대한 액세스를 요청할 수 있는 방법은 없는 듯합니다. 알파에 액세스할 수 있는 소수의 사용자 목록에 있는 경우 지침이 포함된 이메일과 ChatGPT 앱에서 음성 모드를 시도해 볼 수 있는 알림을 받게 됩니다.
고급 음성 모드는 주니퍼, 앰버, 코브, 브리즈의 4가지 사전 설정 음성으로만 말할 수 있습니다. 주목할 점은 OpenAI가 Sky를 제거했다는 것입니다. Sky는 봄 행사에서 데모가 공개된 직후 스칼렛 요한슨처럼 들렸고, 그 배우는 회사에 음성이 어떻게 만들어졌는지 묻는 편지를 보냈습니다(OpenAI는 이에 응답하지 않은 듯합니다). Sky는 여전히 명단에 포함되지 않은 듯합니다.
ChatGPT-4o는 또한 사용자 개인 정보를 보호하기 위해 사전 설정에 있는 음성 외의 다른 음성으로 출력을 제공할 수 없습니다. 또한 폭력적이거나 저작권이 있는 콘텐츠에 대한 요청을 차단하는 보호 장치도 있습니다.
ChatGPT 앱에서 고급 음성 모드를 사용할 수 있다면 계속해서 시도해 보세요. 비전 기능을 획득하기 전까지는 데모에서 보여준 모든 기능을 사용할 수 없지만, 액세스 권한이 있는 사용자가 공유한 일부 비디오에 따르면 여전히 꽤 인상적입니다.
답글 남기기