AI 에이전트 최고 서비스는 무엇이 될까요? 최근 가장 핫한 키워드로 떠오르고 있는데 구글, 엔트로픽, 오픈AI에서 각각 앞다투어 자사 서비스에 대한 정보를 쏟아내고 있습니다. 오늘은 이게 무엇을 의미하는지 각 사의 서비스는 무슨 차이가 있는지 핵심만 알려드리겠습니다.
한줄평: 2025년 가트너가 주목한 핵심 기술 'AI 에이전트', 세계 최고의 AI 기업들이 치열한 경쟁을 하고 있으나 아직은 비슷비슷하다

목차
AI 에이전트가 뭐길래? 인공지능이 대신 일해준다고?
AI 에이전트는 단순한 챗봇이나 음성 비서를 넘어선 차세대 인공지능 기술입니다. 2022년 9월, 스타트업 어뎁트가 ‘도구를 사용하는 AI’를 발표하면서 시장의 주목을 받기 시작했어요. 이 기술의 핵심은 인간의 세부적인 지시 없이도 AI가 스스로 계획을 수립하고, 필요한 도구들을 활용해 복잡한 업무를 처리할 수 있다는 점이에요.
예를 들어, “다음 달 도쿄 출장 준비해줘”라고 하면 AI 에이전트는 다음과 같은 일들을 자동으로 처리할 수 있어요:
- 출장 일정에 맞는 항공편 검색 및 예약
- 회사 위치와 가까운 호텔 찾기
- 현지 날씨 확인 및 준비물 리스트 작성
- 이동 경로 최적화 및 교통편 예약
- 미팅 일정 조율 및 캘린더 업데이트
- 필요한 서류 준비 및 정리
이런 기능이 가능한 이유는 AI 에이전트가 세 가지 핵심 기술을 통합했기 때문이에요:
- 강력한 대형언어모델(LLM)을 통한 자연어 이해 및 처리
- 다양한 도구와 서비스를 연결하는 프레임워크
- 목표 달성을 위한 자율적인 의사결정 능력
가트너가 2025년 주요 기술 트렌드 1위로 AI 에이전트를 선정한 것도 바로 이런 혁신적인 잠재력 때문이에요. 특히 기업들은 AI 에이전트를 통해 얻을 수 있는 세 가지 큰 이점에 주목하고 있습니다:
- 생산성 혁신: 반복적이고 시간 소모적인 업무를 AI가 처리함으로써, 직원들은 더 창의적이고 전략적인 업무에 집중할 수 있어요.
- 비용 절감: 24시간 365일 쉬지 않고 일할 수 있는 AI 에이전트를 활용하면, 운영 비용을 크게 줄일 수 있죠.
- 일관된 서비스 품질: 인간과 달리 AI는 피로나 감정의 영향을 받지 않고 항상 일정한 품질의 서비스를 제공할 수 있어요.
하지만 이런 AI 에이전트를 개발하는 것은 결코 쉽지 않습니다. 현재 기업들이 직면한 주요 과제들은 다음과 같아요:
- 안전성과 신뢰성: AI 에이전트가 중요한 업무를 처리하는 만큼, 오류나 실수가 없도록 하는 것이 매우 중요합니다.
- 모델 성능: 기반이 되는 LLM의 성능이 충분히 뛰어나야 복잡한 업무를 처리할 수 있어요. 지금까지는 모델 성능이 기대에 미치지 못했다는 평가가 많았죠.
- 프레임워크 구축: AI가 다양한 도구와 서비스를 원활하게 사용할 수 있도록 하는 프레임워크를 개발하는 것이 중요해요.
최고의 AI 에이전트 누가 될까?
앤트로픽, 오픈AI에 이어 구글도 AI 에이전트를 개발하겠다고 나선 가운데 성능에 대해서 다들 궁금해하고 있는데요. 과연 어떤 특징들이 있을지 비교해 보겠습니다.
🏃♂️ 경쟁의 서막: 앤트로픽의 ‘컴퓨터 유즈’ vs 오픈AI의 비밀병기
앤트로픽이 먼저 움직였어요. 2024년 10월 22일에 ‘컴퓨터 유즈’라는 AI 에이전트를 공개했는데, OS월드 벤치마크에서 14.9%를 기록하며 2위(7.8%)를 크게 앞섰어요. 이 에이전트는 웹사이트 개발부터 스프레드시트 편집까지 다양한 컴퓨터 작업을 할 수 있대요.
앤트로픽(Anthropic)의 Computer Use
- 개발 현황:
- 2024년 10월 22일에 공개된 ‘컴퓨터 유즈(Computer Use)’ 베타 버전
- Claude 3.5 Sonnet의 API를 통해 서비스 제공
- 현재는 개발자 대상 퍼블릭 베타 단계
- 주요 기능:
- UI 인식 기반의 자율적 컴퓨터 조작 가능
- 웹사이트 개발, 스프레드시트 편집 등 수행
- 다단계 작업 수행 능력 보유 (10~수백 단계)
- API를 통한 컴퓨터 인터페이스 인식 및 상호작용
- 성능:
- OSWorld 벤치마크에서 스크린샷 기반 작업 수행 14.9% 기록 (2위 7.8%)
- 복잡한 작업(예: 항공편 예약 수정)의 성공률은 50% 미만
- Amazon, Asana, Canva, Notion 등에서 베타 테스트 진행 중
반면 오픈AI는 이미 내부적으로 더 강력한 AI 에이전트를 개발해서 시연까지 마쳤다고 해요. 음식 배달 주문도 하고, 코딩 문제도 해결하는 모습을 보여줬다네요. 특히 코딩 에이전트는 이미 내부에서 활발히 사용 중이라고 해요. 챗GPT의 코딩 능력이 클로드보다 부족하다고 판단해서 몇 달간 집중적으로 개발한 결과물이래요.
오픈AI의 AI 에이전트
- 개발 현황:
- 내부 개발 완료 및 시연 단계
- 공식 출시 일정은 미공개
- 코딩 에이전트는 이미 내부에서 활용 중
- 주요 기능:
- 범용 컴퓨터 제어 기능
- 웹 기반 작업 수행 (예: 음식 배달 주문)
- 고도화된 코딩 능력
- 문제 해결을 위한 웹 검색 및 정보 활용
- 특징:
- ChatGPT 대비 향상된 코딩 능력에 중점
- 내부 연구 지원 도구로 활용 중
- ‘Canvas’ 등 코드 저장소 통합 기능 개발 검토
🎮 구글 AI 에이전트 ‘자비스’로 승부수를 던지다
구글은 12월에 ‘자비스’라는 이름의 AI 에이전트를 출시할 예정이에요. 영화 ‘아이언맨’의 AI 비서와 같은 이름을 쓴 게 재밌죠? 자비스는 주로 웹 브라우저, 특히 크롬에서 작동하도록 설계됐어요. 검색, 제품 구매, 항공편 예약 같은 일상적인 웹 작업을 자동화하는 데 초점을 맞췄대요.
구글의 자비스는 다른 회사들과 좀 다른 접근을 보여줘요. 앤트로픽의 컴퓨터 유즈가 다양한 앱을 다룰 수 있는 반면, 자비스는 웹 브라우저에 특화됐거든요. 하지만 소비자들이 실제로 자주 사용하는 기능에 집중했다는 점에서 실용적인 선택으로 보여요.
구글의 Project Jarvis
- 개발 현황:
- 2024년 12월 출시 예정
- 초기에는 소수 테스터 대상 미리보기 형태로 공개 계획
- Gemini 기반 모델 사용 예정
- 주요 기능:
- Chrome 브라우저 특화 운영
- 웹 기반 검색, 제품 구매, 항공편 예약 등 수행
- 스크린샷 기반 화면 해석 및 작업 수행
- 특징:
- 소비자 중심의 일상적 웹 작업 자동화에 초점
- 추론 중심 모델 적용으로 작업 전 사고 과정 포함
- 브라우저 제한적 운영 (크롬 브라우저 특화)
🏆 셋의 전쟁: 누가 승자가 될 것인가?
각 회사별로 특징과 장단점을 정리해볼게요:
앤트로픽
- 장점: 가장 먼저 공개 서비스를 시작했고, OS월드 벤치마크에서 우수한 성능을 보임
- 단점: 아직 베타 테스트 단계라 성공률이 50% 미만
오픈AI
- 장점: 가장 포괄적인 기능을 갖췄고, 특히 코딩 능력이 뛰어남
- 단점: 아직 공개 일정이 불확실함
구글
- 장점: 크롬 브라우저와의 완벽한 통합, 일상적인 웹 작업에 특화
- 단점: 기능이 웹 브라우저로 제한되어 있음
결국 AI 에이전트 시장의 승자는 누가 될까요? 아직은 시기상조예요. 하지만 한 가지 확실한 건, 이 경쟁이 AI 기술 발전을 크게 촉진할 거라는 거예요. 특히 2025년까지는 특정 분야에 특화된 에이전트들이 계속해서 나올 것으로 예상됩니다. 우리는 이제 AI와 함께 일하는 새로운 시대의 문턱에 서 있는 거죠!