AI에 외치다, “진행시켜!”… AI 에이전트 시대 오나 [한세희 테크&라이프]
AI 에이전트 현실로...컴퓨터 유스 등장
하지만 결코 완벽하지 않은 AI 기술
[한세희 IT 칼럼니스트] 직장인은 업무 시간의 상당 부분을 발주나 납품, 재무 처리를 위한 서류에 데이터를 채우는 일로 보낸다. 여기에 들어갈 정보는 직원 이메일이나 엑셀 장부, 고객관리 시스템 등에 흩어져 있다. 우리는 이런 정보들을 직접 찾아가며 서류를 만들어야 한다. 이런 번거로운 일들을 인공지능(AI)이 대신해 줄 수는 없을까?
조만간 가능해질 지도 모르겠다. 미국 AI 스타트업 앤스로픽이 최근 자사 초거대 언어모델(LLM) 기반 생성형 AI 서비스의 새 버전 ‘클로드 3.5 소넷’을 공개하며 ‘컴퓨터 유스(computer use)’라는 기능을 새로 선보였다.
나 대신 컴퓨터로 일하는 AI
컴퓨터 유스는 사람 대신 AI 모델이 컴퓨터를 써서 여러 가지 일을 대신해 주는 기능이다. AI가 스크린을 보고, 커서를 움직이며 버튼을 클릭한다. “내 PC와 웹에 있는 데이터를 찾아 이 서식을 작성해 줘”라고 명령하면 PC에 저장된 엑셀 파일을 열거나 브라우저를 작동시켜 적절한 정보를 찾아 빈 칸을채운다.
앤스로픽은 개별 도구들을 AI 모델이 활용 가능한 형태로 수정하지않았다. 대신 AI 모델에 일반적인 컴퓨터 활용 방법을 학습시켰다. 그래서 프로그램 종류에 얽매이지 않고 여러 소프트웨어나 컴퓨터 기능을 AI가 활용할 수 있다. 방대한 텍스트를 학습한 AI 모델이 자연스러운 문장을 내뱉을 수 있게 된 것처럼, 사람의 컴퓨터 사용법을 학습한 AI가 컴퓨터를 다룰 줄 알게 된 것이다.
사용자가 원하는 바를 일상 문장으로 지시하면 AI가 알아서 일을 진행시켜 완성할 수 있다는 말이다. 영화 ‘아이언맨’의 ‘자비스’나 ‘허’의 ‘사만다’처럼 주인의 상황을 찰떡 같이 이해하고 필요한 일을 알아서 챙기는 것이다. 우리가 막연하게 AI를 상상할 때 기대하는 것들이 한발 더 현실에 가까워진 셈이다.
이런 AI를 요즘 ‘AI 에이전트’라고 흔히 부른다. 영어 단어 ‘에이전트(agent)’는 다른 사람의 일을 대신해 주는 대리인 등을 뜻한다. 어느 정도의 독립성을 갖는다는 뉘앙스가 있다. AI 에이전트는 스스로 일의 순서와 흐름을 짜고, 활용 가능한 도구들을 써서 자율적으로 작업을 하는 시스템이다. 사용자의 요구에 대응해 갖고 있는 정보와 주변 상황을 파악하고, 요구를 충족하는데 필요한 정보와 활용 가능한 도구 등을 따져 가며 작업을 수행한다.
누구에게나 비서를…AI 에이전트 등장
IBM은 사용자가 “내년 그리스에서 서핑을 하기 가장 좋은 날씨가 될 것 같은 시기를 예측해 달라“고 요구하는 상황을 예로 들어 AI 에이전트를 소개한다. 날씨에 대한 정보가 없는 이 AI 에이전트는 외부 기상 데이터베이스에서 최근 몇 년 간 그리스 날씨 정보를 수집하고, 서핑을 전문으로 하는 또 다른 에이전트와 통신해 ‘만조와 비가 내리지 않는 화창한 날씨’가 서핑하기 좋은 시기라는 사실을 파악한다. 이 정보를 바탕으로 다시 내년 그리스의 어느 시기에 만조가 있고 날씨가 좋을지 예측해 사용자에게 알려주는 것이다. 이런 정보를 기억하여 다음에 비슷한 요청에 더 잘 대응할 수 있게 된다.
AI 에이전트는 채팅 창을 빠져나온 초거대 언어모델이라고 할 수도 있다. 챗GPT 초기를 생각해 보면, (필자는 세상에 나온 지 2년 밖에 안 된 챗GPT를 두고 초기 운운하는 것이 어색하긴 하지만, 그간 변화가 너무 빨라 마치 오래 전처럼 느껴진다) 챗GPT에 검색이나 항공권 예약, 장보기 등 외부 앱의 기능을 추가해 마치 생성형 AI를 위한 앱스토어 같은 것을 만들려는 시도가 있었다. 텍스트밖에 못 다루는 챗GPT로 일상에 필요한 유용한 기능을 수행하기 위한 시도였다.
하지만 이후 AI 기술의 급속한 발달로 우리는 채팅 창에 얽매이지 않는 생성형 AI를 ‘AI 에이전트’라는 이름으로 사용할 수 있게 되었다. 이미지, 영상, 소리 등을 다루는 멀티모달 AI의 발달도 힘을 보탰다.
이런 발전에 힘입어 여러 기업들이 AI 에이전트들을 내놓고 있다. 마이크로소프트도 최근 기업 고객을 대상으로 업무 자동화를 위한 AI 에이전트 10종을 선보였다. 자사 생성형 AI 서비스 ‘코파일럿’ 기반이다. 여러 데이터를 종합해 최우선적으로 영업력을 쏟아야 할 고객이 어디인지 자동으로 판단하는 에이전트나, 공급망을 추적해 문제가 발생할 가능성이 있는 지점을 미리 파악하는 에이전트 등이다. 코파일럿으로 자동화 에이전트를 직접 만드는 기능도 공개할 예정이다. 세일즈포스, 아사나 등 여러 기업용 소프트웨어 기업들이 각자 분야에서 비슷한 AI 에이전트들을 내놓고 있다.
사람이 해야 할 일을 요청하면 AI가 알아서 계획을 짜고 정보를 모으고 도구를 찾아 일을 수행한다는 약속을 제시한다. 직장인의 낙원인 셈이다. 직원이 필요 없어 정리될 때까지는 말이다.
물론, 이 같은 약속이 온전히 이뤄질 수 있을지는 장담하기 어렵다. 앤스로픽은 컴퓨터 유스가 아직 ‘실험적 기능’이며
“오류와 실수가 많을 수 있다”고 인정한다. 피드백을 받아 기술 발전을 촉진하기 위해 미리 공개했다는 것이다. 그간 업무 문제를 해결해 준다는 소프트웨어나 AI의 모든 약속들은 우리를 많이 편리하게 해 주었지만, 결코 완벽한 적은 없었다.
개인정보나 프라이버시 문제도 간과할 수 없다. AI가 내 컴퓨터나 온라인에 저장된 정보에 얼마나 접근할 수 있게 할 것인가? 외부 망과 연결된 AI가 나의 민감한 정보를 유출할 우려도 있다. PC 화면을 쉴 새 없이 스크린샷으로 찍고 AI가 분석해 정보를 쉽게 찾고 업무를 돕는다는 마이크로소프트의 ‘리콜(Recall)’ 기능은 프라이버시 우려로 출시를 늦춰야 했다. 그렇더라도 사람의 머리를 써야만 가능했던 일도 기계에 맡긴다는 인류의 오랜 소망에 한걸음 더 가까워졌다는 생각만으로 기분은 좋아진다.
수하에게 일을 명령하는 배우 이경영처럼 우리도 AI에 말할 수 있게 될까? “AI, 진행시켜!”
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지
조만간 가능해질 지도 모르겠다. 미국 AI 스타트업 앤스로픽이 최근 자사 초거대 언어모델(LLM) 기반 생성형 AI 서비스의 새 버전 ‘클로드 3.5 소넷’을 공개하며 ‘컴퓨터 유스(computer use)’라는 기능을 새로 선보였다.
나 대신 컴퓨터로 일하는 AI
컴퓨터 유스는 사람 대신 AI 모델이 컴퓨터를 써서 여러 가지 일을 대신해 주는 기능이다. AI가 스크린을 보고, 커서를 움직이며 버튼을 클릭한다. “내 PC와 웹에 있는 데이터를 찾아 이 서식을 작성해 줘”라고 명령하면 PC에 저장된 엑셀 파일을 열거나 브라우저를 작동시켜 적절한 정보를 찾아 빈 칸을채운다.
앤스로픽은 개별 도구들을 AI 모델이 활용 가능한 형태로 수정하지않았다. 대신 AI 모델에 일반적인 컴퓨터 활용 방법을 학습시켰다. 그래서 프로그램 종류에 얽매이지 않고 여러 소프트웨어나 컴퓨터 기능을 AI가 활용할 수 있다. 방대한 텍스트를 학습한 AI 모델이 자연스러운 문장을 내뱉을 수 있게 된 것처럼, 사람의 컴퓨터 사용법을 학습한 AI가 컴퓨터를 다룰 줄 알게 된 것이다.
사용자가 원하는 바를 일상 문장으로 지시하면 AI가 알아서 일을 진행시켜 완성할 수 있다는 말이다. 영화 ‘아이언맨’의 ‘자비스’나 ‘허’의 ‘사만다’처럼 주인의 상황을 찰떡 같이 이해하고 필요한 일을 알아서 챙기는 것이다. 우리가 막연하게 AI를 상상할 때 기대하는 것들이 한발 더 현실에 가까워진 셈이다.
이런 AI를 요즘 ‘AI 에이전트’라고 흔히 부른다. 영어 단어 ‘에이전트(agent)’는 다른 사람의 일을 대신해 주는 대리인 등을 뜻한다. 어느 정도의 독립성을 갖는다는 뉘앙스가 있다. AI 에이전트는 스스로 일의 순서와 흐름을 짜고, 활용 가능한 도구들을 써서 자율적으로 작업을 하는 시스템이다. 사용자의 요구에 대응해 갖고 있는 정보와 주변 상황을 파악하고, 요구를 충족하는데 필요한 정보와 활용 가능한 도구 등을 따져 가며 작업을 수행한다.
누구에게나 비서를…AI 에이전트 등장
IBM은 사용자가 “내년 그리스에서 서핑을 하기 가장 좋은 날씨가 될 것 같은 시기를 예측해 달라“고 요구하는 상황을 예로 들어 AI 에이전트를 소개한다. 날씨에 대한 정보가 없는 이 AI 에이전트는 외부 기상 데이터베이스에서 최근 몇 년 간 그리스 날씨 정보를 수집하고, 서핑을 전문으로 하는 또 다른 에이전트와 통신해 ‘만조와 비가 내리지 않는 화창한 날씨’가 서핑하기 좋은 시기라는 사실을 파악한다. 이 정보를 바탕으로 다시 내년 그리스의 어느 시기에 만조가 있고 날씨가 좋을지 예측해 사용자에게 알려주는 것이다. 이런 정보를 기억하여 다음에 비슷한 요청에 더 잘 대응할 수 있게 된다.
AI 에이전트는 채팅 창을 빠져나온 초거대 언어모델이라고 할 수도 있다. 챗GPT 초기를 생각해 보면, (필자는 세상에 나온 지 2년 밖에 안 된 챗GPT를 두고 초기 운운하는 것이 어색하긴 하지만, 그간 변화가 너무 빨라 마치 오래 전처럼 느껴진다) 챗GPT에 검색이나 항공권 예약, 장보기 등 외부 앱의 기능을 추가해 마치 생성형 AI를 위한 앱스토어 같은 것을 만들려는 시도가 있었다. 텍스트밖에 못 다루는 챗GPT로 일상에 필요한 유용한 기능을 수행하기 위한 시도였다.
하지만 이후 AI 기술의 급속한 발달로 우리는 채팅 창에 얽매이지 않는 생성형 AI를 ‘AI 에이전트’라는 이름으로 사용할 수 있게 되었다. 이미지, 영상, 소리 등을 다루는 멀티모달 AI의 발달도 힘을 보탰다.
이런 발전에 힘입어 여러 기업들이 AI 에이전트들을 내놓고 있다. 마이크로소프트도 최근 기업 고객을 대상으로 업무 자동화를 위한 AI 에이전트 10종을 선보였다. 자사 생성형 AI 서비스 ‘코파일럿’ 기반이다. 여러 데이터를 종합해 최우선적으로 영업력을 쏟아야 할 고객이 어디인지 자동으로 판단하는 에이전트나, 공급망을 추적해 문제가 발생할 가능성이 있는 지점을 미리 파악하는 에이전트 등이다. 코파일럿으로 자동화 에이전트를 직접 만드는 기능도 공개할 예정이다. 세일즈포스, 아사나 등 여러 기업용 소프트웨어 기업들이 각자 분야에서 비슷한 AI 에이전트들을 내놓고 있다.
사람이 해야 할 일을 요청하면 AI가 알아서 계획을 짜고 정보를 모으고 도구를 찾아 일을 수행한다는 약속을 제시한다. 직장인의 낙원인 셈이다. 직원이 필요 없어 정리될 때까지는 말이다.
물론, 이 같은 약속이 온전히 이뤄질 수 있을지는 장담하기 어렵다. 앤스로픽은 컴퓨터 유스가 아직 ‘실험적 기능’이며
“오류와 실수가 많을 수 있다”고 인정한다. 피드백을 받아 기술 발전을 촉진하기 위해 미리 공개했다는 것이다. 그간 업무 문제를 해결해 준다는 소프트웨어나 AI의 모든 약속들은 우리를 많이 편리하게 해 주었지만, 결코 완벽한 적은 없었다.
개인정보나 프라이버시 문제도 간과할 수 없다. AI가 내 컴퓨터나 온라인에 저장된 정보에 얼마나 접근할 수 있게 할 것인가? 외부 망과 연결된 AI가 나의 민감한 정보를 유출할 우려도 있다. PC 화면을 쉴 새 없이 스크린샷으로 찍고 AI가 분석해 정보를 쉽게 찾고 업무를 돕는다는 마이크로소프트의 ‘리콜(Recall)’ 기능은 프라이버시 우려로 출시를 늦춰야 했다. 그렇더라도 사람의 머리를 써야만 가능했던 일도 기계에 맡긴다는 인류의 오랜 소망에 한걸음 더 가까워졌다는 생각만으로 기분은 좋아진다.
수하에게 일을 명령하는 배우 이경영처럼 우리도 AI에 말할 수 있게 될까? “AI, 진행시켜!”
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지
많이 본 뉴스
1尹 조사 앞둔 공수처, 수사 준비 속도…성탄절 출석 응할까
2日 자녀없는 고령남성 2050년 2배 증가…고독사 우려 커져
3 남태령 경찰차벽 28시간여만에 철수…“트랙터 관저까지 행진”
4“강용석, 4년간 변호사 못한다”…도도맘 무고교사 유죄 확정
5‘크리스마스 이브’, 사람 가장 많이 모이는 곳 명동 아닌 ‘이곳’
6‘이재명은 안된다’ 선관위 현수막 불허에…국힘 “편파적 결정”
7금융자산 10억 이상 ’부자‘ 46만명…300억이상도 1만명 넘어
8비트코인, 나흘 만에 하락세 ‘멈춤’…9만7000달러대 거래
99980원 ‘초가성비’…3주 만에 1만5000개 팔린 케이크