지난해 인공지능 업계를 뜨겁게 달군 기술이 바로 LLM(Large Language Model)이었죠. 텍스트 생성, 번역, 요약, 질의응답 등 텍스트 중심의 생성형 AI로 다양한 분야에서 혁신을 일으켰습니다. 그런데 이제 2024년, AI 기술이 또 한 번 도약하고 있습니다. 그 주인공은 바로 LAM (Large Action Model), 대규모 행동 모델입니다. LAM은 단순히 텍스트를 생성하는 것을 넘어, 실제로 인간의 작업을 대신 수행하는 능력을 갖춘 차세대 AI 모델로 주목받고 있습니다.

<LAM은 가까운 미래에 인간의 삶에 깊숙이 관여할 것으로 예상>
LAM이란?
LAM은 인간의 의도를 이해하고 복잡한 작업을 독립적으로 수행하는 AI 에이전트입니다. 텍스트 기반 응답을 제공하는 LLM과는 달리, LAM은 여러 애플리케이션, 서비스, 그리고 IoT 장치와 상호작용하여 특정 목표를 달성하는 데 최적화되어 있습니다. 예를 들어, 여행 계획을 세운다고 가정해 보죠. LLM은 필요한 정보를 검색해 텍스트로 제시할 수 있지만, LAM은 항공편 예약, 호텔 예약, 교통편 예약 등을 AI가 직접 수행하여 사용자가 별도로 조작할 필요가 없도록 만들어줍니다
LAM의 실제 사례와 응용 서비스
Rabbit R1: CES 2024에서 소개된 Rabbit R1은 LAM의 능력을 보여주는 대표적인 디바이스입니다. 사용자가 음성 명령을 내리면 Rabbit R1은 클라우드 상의 가상 컴퓨터와 연결되어, 사용자가 원하는 택시 호출, 음악 재생, 쇼핑 등을 손쉽게 수행합니다. 앱을 일일이 켜지 않아도 음성 명령으로 모든 작업이 가능한 것이죠
도이치텔레콤의 앱프리폰: MWC 2024에서 도이치텔레콤이 공개한 앱프리폰은, 앱을 설치하지 않고도 AI 에이전트에게 항공편 및 호텔 예약과 같은 다양한 작업을 맡길 수 있는 혁신적인 기능을 제공합니다. 사용자는 복잡한 조작 없이 AI가 알아서 업무를 처리하는 시대를 체험할 수 있습니다
Ferret-UI: 애플의 MLLM(Multimodal Large Language Model)인 Ferret-UI는 스마트폰의 화면을 인식해 사용자의 지시에 따라 앱을 실행하고 화면을 제어합니다. 터치 대신 음성으로 앱을 작동시킬 수 있어, AI 기반의 사용자 경험을 극대화합니다
LAM vs LLM
구분 | LLM | LAM |
핵심 기능 | 텍스트 이해 및 생성 | 작업 실행 포함 |
데이터 처리 | 주로 텍스트 데이터 | 다양한 데이터 유형 |
상호작용 | 텍스트 기반 출력 | 외부 시스템과 상호작용 |
학습 방식 | 언어 패턴 학습 | 행동 피드백 통한 학습 |
LM과 LAM은 AI의 두 가지 중요한 흐름을 보여줍니다. LLM은 텍스트 생성에 특화된 반면, LAM은 실제 행동을 수행하는 능력을 갖추고 있습니다. 예를 들어, LLM은 이메일 초안을 작성하는 데 도움을 줄 수 있지만, LAM은 초안을 작성하고 필요한 문맥을 이해하여 자동으로 이메일을 보낼 수 있습니다. 이러한 차이로 인해 LAM은 인간의 작업을 더욱 효율적으로 대체할 수 있으며, 초개인화 및 자동화된 서비스를 구현하는 데 핵심적인 역할을 할 것으로 기대됩니다.
LAM의 잠재력과 향후 전망
AI 기술이 발전함에 따라 LAM은 다양한 산업에 걸쳐 인간과의 상호작용을 혁신적으로 변화시킬 수 있습니다. 특히, 고객 서비스, 일정 관리, 예약 시스템 등 복잡한 상호작용이 필요한 업무에 LAM이 도입된다면 사용자의 편의성은 크게 향상될 것입니다. 이러한 기술은 인류의 생산성을 높이고, 초자동화와 개인화를 통한 새로운 경험을 제공할 것으로 기대됩니다.
앞으로 AI 업계에서 LAM이 보여줄 가능성에 주목해 보세요. 2024년은 LAM이 기술 혁신을 이끄는 해가 될 것입니다.