본문 바로가기
ICT

주요 AI 기업, 음성비서 서비스 경쟁 본격화...차별점은?

by 이코리아 티스토리 2024. 9. 26.
728x90
= 오픈AI X 갈무리

AI 기술의 발전이 가속화되면서, 기업들이 음성 기반 챗봇 서비스에 주목하고 있다. 오픈AI, 메타, 구글 등 AI 챗봇을 서비스하는 기술 기업들이 이용자와 자연스러운 상호작용이 가능한 음성 서비스를 잇따라 선보이며 음성 비서 경쟁에 돌입했다.

 

오픈AI는 24일 챗 GPT에 새로운 '고급 음성(Advanced Voice)' 기능을 출시한다고 밝혔다. 고급 음성 기능은 이번주 동안 순차적으로 챗 GPT의 유료 구독 서비스 '챗 GPT 플러스'와 '챗 GPT 팀' 이용자들을 대상으로 추가될 예정이다. 다만 규제의 영향으로 EU, 영국, 스위스 등 유럽 지역에서는 음성 기능 제공이 보류되었다.

 

오픈 AI는 챗 GPT가 이용자의 명령에 영어, 중국어로 "늦게 와서 죄송합니다"라고 말하는 영상을 게시하며, 새로운 고급 음성 기능이 한국어를 포함해 50개 언어를 지원한다는 점을 강조했다. 또 5종류의 새로운 목소리가 추가되었으며 자연스러운 억양 처리도 가능하다. 

 

다만 지난 봄 고급 음성 기능이 처음 공개될 때 함께 공개되었던 'Sky'라는 여성의 목소리는 영화 배우 스칼렛 요한슨과의 유사성이 문제가 되어 이번 출시에서 빠지게 되었다. 당시 오픈 AI는 요한슨 측이 법적 대응을 시사하자 즉시 목소리를 도용할 의도가 없었다고 밝히며 해당 목소리를 삭제했다.

= 오픈AI 누리집

 

유료 이용자라도 새로운 고급 음성 기능을 무제한으로 사용할 수 있는것은 아니다. 오픈 AI는 고급 음성 일일 사용에는 매일 제한이 적용되며, 일일 제한 분량은 변경될 수 있다고 밝혔다. 또 창작자의 권리를 존중하기 위해 노래 부르기를 포함한 음악 콘텐츠 생성은 제한된다.

 

오픈 AI는 앞으로 챗 GPT에 다양한 멀티모달 기능을 추가해나갈 예정이다. 지난 5월 오픈 AI는 이용자가 휴대전화의 카메라로 수학문제나 그래프를 보여주면 AI가 이에 대해 말로 설명해주고, 종이에 손으로 쓴 글씨를 인식하는 등 개선된 영상 인식 기능을 시연하기도 했다.

= 구글 누리집

경쟁사들 역시 자사의 AI 서비스에 음성 기능을 추가하고 있다. 구글은 지난 8월 유료 AI 음성비서 서비스 '제미나이 라이브'를 선보였다. 제미나이 라이브는 구글의 최신 AI 기술을 기반으로 한 개인 맞춤형 어시스턴트 서비스로, 사용자와 자연스러운 대화를 통해 다양한 작업을 처리할 수 있다.

 

구글은 향상된 음성 엔진 덕분에 제미나이가 더 일관되고 감정적으로 표현력이 풍부하며 현실적인 대화를 제공할 수 있다고 강조했다. 사용자는 음성 명령을 통해 구글 킵(Keep)이나 태스크(Tasks)와 같은 다른 구글 서비스와 연동해 필요한 정보를 얻고 작업을 수행할 수 있으며, 핸즈프리 모드를 통해 백그라운드에서도 AI와의 대화를 지속할 수 있다. 구글은 앞으로도 제미나이를 더욱 강화하여 유튜브 뮤직, 구글 캘린더 등과의 연동 기능을 확대해나갈 예정이다.

= 메타 누리집

메타는 현지시간 25일 '커넥트 2024'에서 유명인의 목소리를 활용한 새로운 AI 챗봇 서비스를 공개했다. 이 서비스는 페이스북, 인스타그램, 왓츠앱 등 메타의 다양한 플랫폼에서 사용할 수 있으며, 배우 주디 덴치, 존 시나, 크리스틴 벨, 아콰피나, 키건 마이클 키 등의 목소리를 제공한다. 이를 통해 사용자는 유명인의 목소리로 답변을 받거나, 농담을 들으며 AI와의 상호작용을 더욱 생생하게 경험할 수 있다.

 

메타 AI는 음성 기능 외에도 사진 분석과 편집 기능을 도입했다. 사용자는 메타 AI와의 대화 중에 사진을 공유하고, 그 사진에 대한 질문을 할 수 있다. 예를 들어, 꽃의 사진을 공유한 후 메타 AI에게 해당 꽃의 종류를 물어볼 수 있다. 뿐만 아니라, 사용자가 원하는 방식으로 사진을 편집해 줄 수도 있다. 사진 속 배경을 교체하거나, 의상을 변경하는 등의 작업이 가능하다.

 

메타는 또한 자동 번역과 더빙 기능을 테스트 중이다. 이 기능은 사용자가 리엘(Reels) 콘텐츠의 오디오를 다른 언어로 자동 번역할 수 있게 하며, 립싱크를 맞춰 해당 언어로 더빙된 콘텐츠를 제공한다. 이 기능은 현재 영어와 스페인어를 사용하는 일부 창작자의 비디오에서 테스트되고 있으며, 향후 더 많은 언어로 확대될 예정이다.

 

메타는 이러한 AI 도구들을 통해 사용자의 일상 경험을 더욱 재미있고 유용하게 만들 계획이다. AI가 생성한 이미지를 페이스북이나 인스타그램의 스토리나 피드에서 공유하거나, AI가 추천한 캡션을 통해 간편하게 콘텐츠를 게시할 수 있는 기능도 제공된다.

 

국내 기업들도 AI 음성비서 개발에 적극적으로 나서고 있다. 삼성전자는 자사의 AI 서비스 '빅스비'를 음성 비서로 고도화하고 있으며, 냉장고나 세탁기, 로봇청소기 등 최신 비스포크 제품에도 빅스비를 탑재해 이용자와 대화를 나눌 수 있도록 했다.

 

SK 텔레콤은 자사의 AI 서비스 '에이닷'에 통화요약 등의 각종 음성 기반 기능을 추가해나가고 있으며, SK브로드밴드는 에이닷과 B tv를 결합해 AI를 기반으로 TV와 실제 사람처럼 대화를 주고받을 수 있는 B tv 에이닷 서비스를 26일 선보였다.

 

현기호 기자

저작권자  이코리아 무단전재 및 재배포 금지

 

더 많은 기사는 '이코리아'(http://www.ekoreanews.co.kr/)