
= 마누스 유튜브 갈무리
[이코리아] 중국의 AI 스타트업 버터플라이 이펙트(중문명 후데샤오잉, 蝴蝶效应)가 지난 5일 출시한 AI 에이전트 '마누스(Manus)'가 글로벌 AI 업계에서 뜨거운 관심을 받고 있다. 마누스 개발진은 자사의 AI 에이전트가 오픈AI의 '딥 리서치(DeepResearch)'를 능가한다고 홍보하며, 이 기술이 AI 에이전트 시장에서 새로운 기준을 제시할 것이라고 주장하고 있다.
마누스는 '다중 에이전트 구조'를 채택해 복잡한 작업을 여러개로 분할해 적절한 에이전트에 할당한다. 그리고 마누스는 작업을 수행하는 모든 에이전트를 관리하는 지휘자의 역할을 한다. 이러한 방식은 단순한 대화형 챗봇과 달리, 마누스가 사용자의 개입 없이 여러 단계를 거쳐 자율적으로 문제를 해결할 수 있다.
공개된 영상에서 마누스는 이력서 정리, 주가 분석, 여행 계획 수립, 부동산 검색 등 이용자가 요청하는 복잡한 작업을 스스로 수행하는 모습을 보여준다. 또 모든 작업은 클라우드에서 수행되어 이용자가 기기를 끈 상황에서도 작업을 지속할 수 있다.
특히 마누스는 AI 에이전트의 성능 평가 기준인 'GAIA 벤치마크'에서 오픈AI의 딥 리서치를 앞선다는 주장이 나오고 있다. GAIA 벤치마크는 AI 에이전트가 주어진 복합적인 작업을 얼마나 효과적으로 수행할 수 있는지를 측정하는 평가 시스템으로, 웹 브라우징, 문서 분석, 논리적 추론 등을 포함한다. 이에 따라 일각에서는 마누스가 '제2의 딥시크'가 될 수 있다는 반응도 나오고 있다.
마누스는 공개 이후 중국의 거대 기술기업 알리바바와 손잡는 등 사업을 확장해나가고 있다. 사우스차이나모닝포스트(SCMP)와 중국 관영매체 차이나데리는 마누스가 알리바바의 대형 언어 모델 개발팀과 협력하여 중국 내수용 AI 에이전트를 구축할 예정이라고 보도했다. 이 협력의 핵심은 알리바바의 개방형 AI 모델 'Qwen'과 마누스를 통합하여 클라우드 기반의 자율 AI 시스템을 더욱 정교하게 만드는 것이다.

= 마누스 유튜브 갈무리
다만 해외 매체와 전문가들 사이에서는 마누스를 실제로 뛰어난 역량을 지닌 '제 2의 딥시크'로 주목하는 의견과, 성능이 실제로는 기대에 미치지 못한다는 거품론이 엇갈리고 있다.
우선 긍정론의 경우 블룸버그는 마누스가 미국 AI 업계의 선두주자들과 경쟁할 만한 잠재력을 보이고 있다고 평가했다. 특히 마누스는 단순한 챗봇이 아니라 "진정한 자율 에이전트"로서 역할을 수행할 수 있는 것이 강점으로 꼽힌다. 초기 사용자 중 일부는 마누스가 "탁월한 품질의 결과물"을 제공한다고 호평했으며, 일부는 오픈AI의 딥 리서치보다 더 나은 결과를 도출하기도 했다고 평가했다.
MIT 테크놀로지 리뷰는 마누스를 테스트한 결과, AI 에이전트로서 높은 직관성과 적응력을 보였다고 평가했다. 연구자들은 마누스를 "고도로 지능적인 인턴과 협업하는 것과 같다"고 묘사하며, 사용자 피드백을 반영하여 작업 품질을 점진적으로 개선하는 능력을 긍정적으로 보았다.
포브스는 마누스의 등장에 대해 "자율 AI 에이전트의 시대가 열렸고 중국이 이를 주도하고 있다. 지능이 더 이상 인간의 고유한 자산이 아닌 세상에서 일하고, 창작하고, 경쟁한다는 것이 무엇을 의미하는지 다시 생각해야 할지도 모른다."라고 전했다.
다만 제한된 이용자 수에도 불구하고 안정성이 부족하다는 지적도 나온다. 블룸버그와 MIT 테크놀로지 리뷰는 마누스가 속도 저하 및 시스템 불안정 문제를 겪고 있다고 지적했다. 블룸버그는 마누스가 오픈AI의 딥 리서치보다 처리 속도가 느리며, 일부 사용자들은 작업 도중 시스템이 충돌하는 문제를 경험했다고 전했다.
테크크런치는 9일 '마누스는 아마 중국의 두 번째 딥시크 모먼트가 아닐 것이다'라는 분석 기사를 통해 마누스의 홍보가 과장되었으며, 기술적 한계가 뚜렷하다고 평가했다. 특히 마누스가 '완전히 자율적인 AI 에이전트'라고 주장하지만, 실제로는 앤트로픽(Anthropic)의 클로드(Claude) 및 알리바바의 Qwen 모델을 결합한 것에 불과하다고 지적했다. 또 마누스의 기술적 세부 사항 역시 구체적으로 공개되지 않은 상황이라 외부에서 그 성능을 객관적으로 평가하기 어렵다는 점도 지적했다.
테크크런치는 직접 테스트한 결과, 마누스가 단순한 작업조차 성공적으로 수행하지 못하는 경우가 많았다고 보도했다. 예를 들어, 음식 배달 주문, 항공권 예약, 게임 개발 등의 요청을 수행하는 과정에서 마누스가 반복적인 오류를 일으키거나 중간에 멈추는 문제가 발생했다. 이러한 점에서 테크크런치는 마누스가 기대만큼 완성된 제품이 아니라는 점을 강조했다.
한편 이어지는 논란에 버터플라이 이펙트측은 마누스가 아직 초기 단계이며, 최종 제품이 구현하려는 성능과는 아직 거리가 멀다고 밝혔다. 또 현재 제한된 이용자들을 상대로 진행중인 클로즈 베타를 통해 다양한 문제점을 발견한 뒤, 점진적으로 기능을 개선하고 초대를 확대해나갈 것이라고 밝혔다.
현기호 기자
저작권자 이코리아 무단전재 및 재배포 금지
더 많은 기사는 '이코리아'(http://www.ekoreanews.co.kr/)
'ICT' 카테고리의 다른 글
'AI 에이전트' 출시 본격화... 이용자 개인정보 침해 우려도 (0) | 2025.03.12 |
---|---|
선진국은 왜 'AI 리터러시' 교육을 의무화할까 (0) | 2025.03.12 |
ESG 경영 속도 내는 KT...주목받는 사회공헌활동은? (0) | 2025.03.10 |
AI 인재 확보나선 글로벌 기술업계, 현황은? (0) | 2025.03.10 |
완성차 업계, 휴머노이드 로봇 도입 가속화...과제는? (0) | 2025.03.10 |