본문 바로가기
ICT

구글, '제미나이 2.0'기반의 AI 에이전트 선보여...주요 기능은?

by 이코리아 티스토리 2024. 12. 12.
728x90
 
= 구글 공식 유튜브 갈무리

 

 

 

[이코리아] 구글이 현지시간 11일 차세대 AI 에이전트 모델 '제미나이 2.0'등 신기술을 대거 선보였다. 올해 2월 '제미나이 1.5'를 내놓은지 10개월만에 차세대 모델을 공개한 것이다.

이날 발표에서 순다 피차이 구글 CEO는 고급 추론 기능을 탑재한 차세대 AI 모델 ‘제미나이 2.0’을 공개하며 구글의 AI 비전을 제시했다.

구글이 공개한 제미나이 2.0은 이전 버전 대비 한층 강화된 성능을 자랑한다. 피차이 CEO는 제미나이 2.0이 지금까지 구글이 출시한 AI 모델 중 가장 유능하며, 특히 언어 처리와 데이터 분석 능력이 크게 개선되어 사용자 경험을 혁신적으로 향상시킬 것이라고 강조했다.

구글은 우선 제미나이 2.0 제품군의 첫 번째 모델인 '제미나이 2.0 플래시'를 먼저 출시한 뒤 앞으로 더욱 상위 모델들을 순차적으로 출시할 예정이다. 2.0 플래시는 이미지, 비디오 및 오디오와 같은 멀티모달 입력을 지원하는 것 외에도 텍스트와 조정 가능한 텍스트-음성(TTS) 다국어 오디오가 혼합된 네이티브 생성 이미지와 같은 멀티모달 출력을 지원한다.

모든 제미나이 사용자는 채팅 최적화 버전인 2.0 플래시를 사용해볼 수 있으며, 모바일 앱에서도 곧 사용 가능해질 예정이다. 또 내년 초에는 더 많은 구글 제품군에 제미나이 2.0이 적용된다.

= 구글 공식 유튜브 갈무리

 

한편 구글은 이날 제미나이 2.0 기반의 새로운 AI 에이전트 모델도 다수 선보였다. 먼저 앞서 공개되었던 모바일 대화형 비서 '프로젝트 아스트라'는 이제 제미나이 2.0을 기반으로 업그레이드 되어 다국어 대화가 가능해졌으며 카메라로 주변을 인식해 실시간으로 정보를 제공하거나, 구글 검색, 렌즈, 지도 등 다양한 구글 앱을 통합적으로 활용할 수 있다. 또 10분 이내로 이용자와의 이전 대화를 기억하고 인간 대화 수준의 지연 시간으로 이전보다 더 빠르게 언어를 이해할 수도 있다.

= 구글 공식 유튜브 갈무리

 

또 AI 에이전트 '프로젝트 마리너'는 이용자의 개입 없이 스스로 컴퓨터를 조작하는 AI로, 인간-에이전트 상호작용의 미래를 탐구하기 위해 개발된 연구 프로토타입이다. 픽셀과 텍스트, 코드, 이미지, 양식과 같은 웹 요소를 포함하여 브라우저 화면의 정보를 이해하고 추론한 뒤, 크롬 확장 프로그램을 통해 작업을 완료할 수 있다.

시연에서 프로젝트 마리너는 '가장 유명한 인상주의 그림을 찾아줘'라는 이용자의 명령에 반 고흐의 '해바라기'를 이용자에게 제시하는 모습을 보여줬다. 구글은 프로젝트 마리너가 이용자 대신 항공권을 예매하고, 정보를 검색해 정리하는 등의 작업을 수행할 수 있지만, 아직은 작업의 정확성과 속도 면에서 제한이 있으며, 상용화에 앞서 지속적인 개선이 필요할 것이라고다.

구글은 현재 프로젝트 마리너를 안전하고 책임감 있게 구축하기 위해, 무언가를 구매하는 것과 같은 특정 민감한 작업을 수행하기 전에 사용자에게 최종 확인을 요청하는 등의 대책에 대해 강구하고 있다고 밝혔다.

이 외에도 개발자를 위한 AI 에이전트 '쥴스', 게임 화면을 관찰해 대화를 통해 게이머가 게임 속 세계를 탐험하는데 도움을 주는 에이전트, 공간 추론 기능을 로봇에 적용하여 물리적 세계에서 도움이 될 수 있는 에이전트 등 다양한 AI 에이전트를 시험하고 있다고 밝혔다.

한편, 구글은 최근 대두되고 있는 AI 안전 문제에 대한 대비책도 함께 발표했다. 구글은 제미나이 2.0의 고급 추론 기능을 활용해 위험 평가와 안전 검증을 강화하고 있으며, 이를 통해 모델을 더욱 안전하게 최적화할 수 있다고 밝혔다.

프로젝트 아스트라의 경우 이용자가 의도치 않게 에이전트와 민감한 정보를 공유하는 것에 대한 대비책을 모색하고 있으며, 세션을 쉽게 삭제할 수 있도록 하는 개인 정보 보호 제어 대책을 구축했다. 또 AI 에이전트가 이용자를 대신하여 의도치 않은 행동을 취하지 않도록 하는 방법을 계속 연구중이다.

프로젝트 마리너의 경우 외부의 악의적 지시(prompt injection)보다 이용자의 지침을 우선하도록 학습시켜 오용을 방지하도록 노력하고 있다고 밝혔다. 이를 통해 이메일, 문서, 웹사이트에 숨겨진 악의적인 지침을 통해 사기 및 피싱에 노출되는 것을 방지할 수 있다. 구글은 앞으로도 책임감 있는 AI 개발을 최우선 과제로 삼아 안전성과 신뢰성을 지속적으로 강화해 나갈 계획이라고 밝혔다.

구글 외에도 다수의 기술 기업들이 AI 에이전트를 선보이고 있다. 구글은 지난달 19일 연례 콘퍼런스 '이그나이트 2024'에서 각종 사이트, 파일, 폴더의 위치를 에이전트에 질문해 실시간 응답을 받을 수 있는 '셰어포인트 에이전트', 각종 급여 정보, 복지 혜택, 휴가 신청 등 인사 정보를 확인하고 절차를 수행하는 것을 도와주는 직원 셀프 서비스 에이전트, 팀즈 회의에서 최대 9개 언어의 실시간 통역을 제공하는 통역 에이전트 등 MS 365 코파일럿 기반의 각종 AI 신기능을 대거 선보였다.

오픈 AI는 '오퍼레이터(Operator)'라는 코드명의 새로운 AI 에이전트의 출시를 준비중이다. 이 에이전트는 코드를 작성하거나 여행 예약을 하는 등 사용자를 대신해 컴퓨터에서 작업을 수행할 수 있으며, 오픈 AI는 내년 1월 우선 오퍼레이터를 연구 프리뷰 형태로 출시하고, 개발자를 위한 API를 통해 제공할 계획이다.

지난 10월에는 AI 스타트업 '앤트로픽'이 자사의 AI 서비스 '클로드 3.5'에 '컴퓨터 유즈' 기술을 공개했다. 이 기술은 사용자의 개입 없이 마우스를 움직이고 화면을 캡쳐하며 구글을 활용해 정보를 검색하고, 앱을 실행하며, 지도에서 위치를 찾고 캘린더에 일정을 등록하는 등 다양한 작업을 수행할 수 있다.

아마존은 지난 4일 연례 행사 'AWS 리인벤트'에서 아마존 베드록(Amazon Bedrock)에 포함된 '다중 에이전트 협업', '수퍼바이저 에이전트' 등의 AI 에이전트 신기능을 공개했다. 또 10일 외신에 따르면 아마존은 AI 에이전트 개발을 위한 새 연구소를 샌프란시스코에 설립했다.

 

 

 

임해원 기자

저작권자  이코리아 무단전재 및 재배포 금지

 

더 많은 기사는 '이코리아'(http://www.ekoreanews.co.kr/)