본문 바로가기
IT테크

OpenAI가 발표한 신규 모델 GPT-4o 소개(폰 끼리 대화 가능?)

by 테크냥이 2024. 5. 14.

오픈 AI가 음성 비서 기능을 강화한 새 멀티모달 모델, GPT-4o를 공개했습니다. 더 빠르고 저렴하며, 인간과의 상호작용을 혁신할 이 기술에 대해 자세히 알아보세요. 

OpenAI가 발표한 신규 모델 GPT-4o 소개(폰 끼리 대화 가능?)

오픈AI, 새로운 멀티모달 모델 GPT-4o 공개

최근 오픈AI가 음성 비서 기능이 대폭 강화된 새로운 멀티모달 모델(GPT-4o)을 공개했습니다. 이 모델은 텍스트, 이미지, 오디오로 실시간 대화가 가능해 사용자와의 상호작용을 한층 더 풍부하게 만들 것으로 예상됩니다.

 

아래에서 오픈AI의 gpt-4o 소개를 확인해 보세요.

 

 

오픈AI, 새로운 멀티모달 모델 GPT-4o 공개

 

GPT-4o의 주요 특징

GPT-4o는 기존 모델보다 훨씬 빠르고 비용 효율적입니다. 구두로 질문을 하면 평균 320밀리 초 안에 오디오로 응답, 사람의 반응 속도와 비슷한 수준입니다. 또한, 50개 언어에 대한 지원과 이미지 처리 기능까지 갖추고 있어 다방면에서 활용이 기대됩니다. 

 

인간과 AI의 상호작용 새 장

GPT-4o는 오픈AI의 기술 발전에서 중요한 이정표를 나타냅니다. 인간과 비슷한 반응 속도로 대화할 수 있으며, 노래로 대답하거나 다른 휴대폰과 상호작용하는 모습을 보여주었습니다. 이는 기술과 인간 사이의 경계를 더욱 흐릿하게 만들며, 상호작용의 질을 한층 더 끌어올릴 것으로 기대됩니다.

  • 말을 끊어도 돌려말하고 감정을 섞어서 이야기하는 한층더 향상된 타이밍과 반응성과 상호작용.

 

시장과 사용자에 미치는 영향

GPT-4o는 향후 애플의 '시리'와 같은 음성 비서에 통합되어 사용될 예정이며, 개발자들을 위한 API도 이미 공개되었습니다. 이를 통해 더 많은 제품과 서비스에서 오픈 AI의 최신 기술을 접할 수 있게 될 것입니다. 

gpt-4o 데모 리뷰 보기

 

위 영상을 보시면 가위바위보를 판정하고 폰끼리 대화, 자장가를 불러주는 등 한차원 더 발전된 기술을 보여줍니다.

요약

오픈AI의 GPT-4o 공개는 음성 비서 기능을 한 단계 업그레이드하는 동시에 AI 기술의 발전을 증명합니다. 더 빠르고, 저렴하며, 다양한 언어와 이미지 처리 기능을 갖춘 이 모델은 앞으로 우리가 AI와 상호작용하는 방식을 변화시킬 것입니다.

반응형

댓글