loading...

AI Agent, 비즈니스 워크플로우와의 통합 – 1편

- AI Agent 시장 동향을 다룬 해당 아티클은 1, 2편으로 나누어 게재됩니다. -

기업은 업무 환경이 급속히 변화함에 따라, 인공지능 기술에 막대한 투자를 할 것으로 예상됩니다. 2024년 11월, 가트너는 IT 심포지엄/엑스포 2024(Gartner IT Symposium/Xpo 2024)에서 2025년에 기업이 탐색해야 하는 10가지 전략 기술 트렌드를 발표하며, 기업의 책임 있는 혁신을 제시했습니다.[1] 가트너의 수석 부사장 애널리스트인 진 알바레즈는 "올해 비즈니스에 영향을 미칠 주요 전략 기술 트렌드를 'AI 필수 요소와 위험', '컴퓨팅의 새로운 지평', '인간-기계 시너지'라는 3가지 테마로 정의한다."고 말했습니다. 'AI 필수 요소와 위험' 테마에는 '에이전트 AI(Agentic AI)', 'AI 거버넌스 플랫폼', '허위 정보 보안' 기술이 포함되며,[2] 이러한 전략 기술들은 인공지능(AI), 컴퓨팅, 인간-기계 상호작용 분야의 급속한 발전을 반영하고 있습니다.

2025년 인공지능의 주요 트렌드는 무엇일까요? 'AI 에이전트(AI Agent)', '초개인화', 'AI ROI 측정', '생성형 AI 보안 제품', '양자 AI', '지능형 자동화(Intelligent Automation)', 'AI-인간 협업' 등으로 정의할 수 있으며, 가트너를 포함한 맥킨지, IBM, 포레스터 등의 글로벌 리서치사와 빅테크 기업 모두 'AI Agent'2025년에 주목해야 할 최고의 AI 트렌드로 꼽았습니다.[3] 인공지능 분야의 핵심 동인인 생성형 AI는 ‘대형 언어 모델(LLM)’ 중심에서 ‘AI 에이전트(AI Agent)’로 빠르게 이동하고 있으며, 이는 비즈니스 가치를 창출하는 데 핵심적인 역할을 할 것으로 기대됩니다. LLM은 기술적으로 경이로움을 주고 있지만, 여전히 인간 수준의 지능에는 미치지 못합니다. 또한, LLM은 매력적인 콘텐츠를 생성하지만, 본질적으로 통계적 예측 엔진이기 때문에, 컨텍스트에 대한 진정한 이해나 고차원적인 추론, 목적을 달성하는 추진력 등은 부족합니다.[4] 이러한 부분에서 AI Agent는 생성형 AI 기능을 실제 실행과 연결함으로써 인공지능의 잠재력을 최대한 발휘할 수 있도록 시너지를 창출합니다.

인공지능의 핵심 기술, AI Agent

AI Agent라는 개념은 어디에서 시작했을까요? 카네기 멜론 대학의 AI 교수인 아난드 라오는 "Agent라는 개념은 사실 매우 오래되었다."라고 말했습니다. 그는 1980년대에 다중 에이전트 시스템에서 일하며 우주 왕복선을 위한 시스템을 구축했는데, 하나의 시스템으로 감당하기에는 너무 복잡했고, 시간이 지남에 따라 각 에이전트는 더 독립적으로 목표와 목적에 따라 실행하게 되었다고 말합니다.[5] 인공지능 기술 측면에서 AI Agent의 아이디어는 트랜스포머나 DPO(Direct Preference Optimization) 등의 기술 혁신과는 다르게 하나의 논문이나 특정 연구 그룹으로 정의하기는 어렵습니다. 이것은 너무 일반적이고 광범위한 개념입니다. 지난 2년 동안 AI 실무자들은 AI 시스템에서 정교한 자율 행동을 가능하게 하는 상호 연관된 일련의 발전을 이루었습니다. 발전의 핵심은 대형 언어 모델(LLM)의 핵심 인텔리전스를 기반으로 구조와 흐름을 구축하여 AI가 자율적으로 행동할 수 있는 능력을 제공하는 것입니다.

AI Agent는 특정 작업을 위해 설계된 고급 인공지능의 한 유형으로, 인간의 기술을 재현하도록 설계된 프로그램입니다. 에이전트는 단순한 챗봇을 넘어 자율적으로 운영되며, 기계 학습 및 자연어 처리를 활용하여 데이터를 분석하고, 의사결정을 내리고, 경험을 통해 학습합니다.[7] AI Agent는 사람의 개입이 거의 없거나 완전히 자율적으로 사전 정의된 목표를 달성하기 위해 결정을 내리고, 계획하고, 적응할 수 있습니다. 목표를 정의하면 AI Agent는 프로세스를 자동화하고 컨텍스트 기반 의사결정을 내려 목표를 달성하는 조치를 취합니다. 상황이 바뀌면 최적의 결과를 위해 전략을 조정할 수 있습니다.[8] 실제 적용되는 시나리오는 단일 기능을 수행하는 기본 프로그램부터 복잡한 작업을 감독하는 정교한 시스템에 이르기까지 다양합니다. AI Agent는 유연성과 학습 능력을 활용하여 불확실한 환경에서 탁월한 성능을 발휘합니다. 인터넷을 검색하고, 애플리케이션과 통신하고, 광범위한 데이터 세트를 처리하고, 트랜잭션에 참여하는 동시에 받은 결과와 피드백에 따라 방법을 조정할 수 있습니다.[9] 이러한 기능을 통해 기업은 비즈니스 워크플로우를 자동화(Hyper-automation)하고, 인간 작업자의 성과를 향상하며, 생성형 AI에서 가치를 창출할 수 있습니다.

AI Agent 작동 방식

AI Agent는 구조화된 환경에서 사전 정의된 일련의 작업을 수행하는 간단한 시스템부터 동적인 상황에서 학습하고 적응하는 정교한 AI에 이르기까지 다양한 복잡성을 가지고 있으며, 기본적으로 다음과 같이 작동합니다.[10][11]

20250115_01_img [그림 1] AI Agent 작동 방식(출처: markovate.com[12])

user request ← AI Agent → Perception, Cognition, Action

Perception

Multi-modal fusion: camera, Text, Audio, Sensors

Cognition

Memory, Knowledge base → Decision making

Action

Executing Tasks: Physical actions in real-world, Monitor

① 인식 및 데이터 수집(Perception & data collection): AI 에이전트는 센서 또는 직접적인 프롬프트를 통해 환경과 상호작용합니다. 센서는 에이전트의 목적에 따라 카메라, 마이크, 터치 센서 또는 특수 장비가 포함될 수 있으며, 입력은 특정 작업의 목표 및 목적 등이 될 수 있습니다. 시스템은 이 정보를 사용하여 결정을 내립니다. 또한, AI Agent는 고객과의 상호작용, 소셜 미디어, 기업 내부의 시스템 데이터 등을 포함한 다양한 소스에서 데이터를 수집하는 것으로 시작합니다. 이러한 데이터는 컨텍스트(맥락)와 뉘앙스를 이해하는 데 중요하며, 실시간 데이터를 통합하고 처리하여 효과적인 결과를 위한 최신 정보를 제공할 수 있습니다.

② 의사결정(Decision-making): 수집된 정보들은 AI Agent의 내부 시스템에서 처리됩니다. 정교한 딥러닝 모델을 사용하여 수집된 데이터를 분석하여 패턴을 식별하고, 알고리즘과 계산 방법을 활용하여 정보를 이해합니다. 처리된 정보를 기반으로 AI Agent는 명시된 목표를 달성하기 위해 '생각'하고 ‘결정’하거나 ‘행동을 선택’합니다. 해당 프로세스는 기계 학습, 규칙 기반 시스템 또는 기타 의사결정 모델과 같은 알고리즘이 포함됩니다. 예를 들어, 과거의 상호작용과 현재 컨텍스트를 기반으로 사용자 쿼리에 대한 가장 적절한 응답을 결정할 수 있습니다. 이전 경험에서 학습하고 시간이 지남에 따라 응답을 정교화하는 Agent의 능력은 이러한 의사결정 프로세스를 향상합니다.

③ 작업 실행(Action execution): AI Agent는 결정이 내려지면 필요한 작업을 실행할 수 있으며, 로봇의 물리적 움직임, 특정 연구, 작업 수행, 응답 생성, 다른 에이전트나 시스템과의 상호작용 등을 포함합니다. 예를 들어, 문의에 응답하거나, 요청을 처리하거나, 복잡한 문제를 담당자에게 에스컬레이션 할 수 있습니다. 실행은 원활하고 효율적으로 설계되어 사용자는 시기적절하게 정확한 응답을 받을 수 있습니다.

20250115_02_img [그림 2] AI Agent 실행 방식(출처: aws.amazon.com[13])
  • Agent ← ① → User
  • Agent ← ② → Feature Store (user profile as movie category preference) [userID, Action, Sci-Fi, Thriller, Western...] ← Users
  • Agent ← ③ → metadate store (1. "the shawshank redemption","the film narrates his journey of resilience, hope, and quest for freedom.","drama/crime",1994),(2."the godfather","the film depicts the transformation of michael corleone...)
  • Agent ← ④ → Language Model (prompt engineering{movie list and description},{user profile},please write a email campaign...)
  • Agent ← ⑤ → Email (subject: [hot] Immerse yourself in the Thrill of Sci-Fi and Action! / Buckle up for a ride through time, space, and alternate realities with our top sci-fi action recommendations just for you)

④ 학습 및 적응(Learning and adaptation): AI Agent는 경험을 통해 학습할 수 있으며, Agent가 받은 피드백에 기반으로 행동을 조정하는 ‘강화 학습’이나, ‘지도 학습’ 또는 ‘비지도 학습’을 통해 이루어집니다. AI Agent는 각 상호작용에서 지속적으로 학습하고 알고리즘을 개선하여 정확성과 효율성을 높입니다. 이를 통해, 향후 상호작용을 향상하고, 고객의 기대치나 비즈니스 환경이 변화하더라도 관련성 있는 상태를 유지할 수 있습니다. 예를 들어, 학습 기능의 결합을 통해 제품 추천, 문제 해결, 후속 상호작용 참여 등의 광범위한 고객 서비스 작업을 자율적으로 처리할 수 있으며, 사람은 더 복잡하고 부가가치가 높은 활동에 집중할 수 있습니다.

AI Agent 유형

AI Agent는 다양한 형태로 제공되며, 다음은 몇 가지 주요한 에이전트의 유형입니다.

20250115_03_img [그림 3] AI Agent 유형(출처: www.magicaiprompts.com[14])

AI 에이전트 분류

높은 기능성 + 낮은 복잡성 : 단순 반사 에이전트

높은 기능성 + 높은 복잡성 : 모델 기반 에이전트

낮은 기능성 + 낮은 복잡성 : 목표 기반 에이전트

낮은 기능성 + 높은 복잡성 : 유틸리티 기반 에이전트

단순 반응 에이전트(Simple Reactive Agents)
단순 반응 에이전트는 '조건-작용(행동 규칙)' 원리를 기반으로 사전 정의된 규칙과 즉각적인 데이터에 따라 작동하는 가장 간단한 에이전트입니다. 주어진 이벤트 조건을 벗어난 상황에는 대응하지 않는데, 이는 주변 세계에 대한 깊은 이해가 없다는 것을 의미합니다. 이러한 에이전트는 광범위한 학습이 필요 없는 간단한 작업에 적합합니다. 예를 들어, 사용자의 대화에서 특정 키워드를 감지할 경우 암호를 초기화하거나, 매일 밤 정해진 시간에 난방 시스템을 켜게 하거나, 고객 챗봇과 같은 일부 시나리오에 적용할 수 있습니다.[10][13][15]

모델 기반 반응 에이전트(Model-Based Reaction Agents)
모델 기반 에이전트는 단순 반응 에이전트와 비슷하지만, 보다 발전된 의사결정 메커니즘을 가지고 있습니다. 모델 기반 반응 에이전트는 단순히 특정 규칙을 따르는 것이 아니라, 가능성 있는 결과와 결론을 평가하여 결정을 내립니다.[13] 모델 기반 에이전트는 현재 인식과 기억을 모두 사용하여 자신이 인지하는 주변 세계에 대한 내부 모델을 구축하고, 주변 환경에 대한 인식을 통해 즉각적으로 명확하지 않은 것을 보거나 예측할 수 있으며, 누락된 정보의 '격차를 메우고' 맥락에 대한 이해를 바탕으로 의사결정을 뒷받침합니다. [10] 예를 들어, 로봇 청소기가 방을 청소할 때 가구 등의 장애물을 감지하고 그 주변을 조정하거나, 이미 청소한 영역의 모델을 저장하여 반복되는 청소 루프에 갇히지 않도록 할 수 있습니다. [15]

목표 기반 에이전트(Goal-based Agents)
목표 기반 에이전트는 환경의 내부 모델과 목표나 목표 집합을 가지고 있으며[15], 보다 강력한 추론 기능을 갖춘 AI 에이전트로 특정 목표를 달성하도록 맞춤화되어 있습니다. 이 에이전트는 환경 데이터를 평가할 뿐 아니라 원하는 결과를 얻을 수 있도록 다양한 접근 방식을 비교합니다. 목표 기반 에이전트는 항상 가장 효율적인 경로를 선택하며, 작업을 계획한 후 실행에 옮깁니다. 이는 매우 복잡한 시나리오를 자율적으로 탐색하고 센서를 통해 환경에 대응할 수 있음을 의미하며, 자연어 처리(NLP) 및 로보틱스 애플리케이션과 같은 복잡한 작업을 수행하는 데 적합합니다.[10][13] 예를 들어, 내비게이션이 목적지까지 가장 빠른 경로를 추천하기 위해 목적지에 도달하는 다양한 경로를 고려하고, 더 빠른 경로가 발견되면 해당 경로를 추천하도록 할 수 있습니다.[15]

20250115_04_img [그림 4] 목표 기반 에이전트 다이어그램(출처: www.ibm.com[15])

Environment → Precepts → Sensors

Agent

sensors → What the world is like now (← State, How the world evolves, What my asctions do) → What action I should do now (← Condition-action rules) → Actuators

Actuators → Action → Enviroment

유틸리티 기반 에이전트(Utility-based Agents)
유틸리티 기반 에이전트는 복잡한 추론 알고리즘을 사용하여 사용자가 원하는 결과를 극대화할 수 있도록 도와줍니다. 이 에이전트는 다양한 시나리오와 각각의 효용 가치 또는 이점을 비교한 후, 사용자에게 가장 많은 유용한 안을 선택합니다. 예를 들어, 고객은 유틸리티 기반 에이전트를 사용하여 가격과 관계없이 이동 시간이 가장 짧은 항공권을 검색하거나[13], 가장 안전하고 빠른 경로를 결정하는 자율 주행 자동차와 같이 최상의 솔루션을 결정해야 하는 경우에 이상적입니다.[10] 또한, 수익을 극대화하거나 손실을 최소화하기 위한 금융거래나, 수요, 경쟁 및 시간대에 따라 실시간 가격을 조정하는 데 활용할 수 있습니다.[37]

학습 에이전트(Learning Agents)
학습 에이전트는 이전 경험을 통해 지속적으로 학습하여 결과를 개선합니다. 이 에이전트는 센서 입력 및 피드백 메커니즘을 사용하여 점진적으로 학습 요소를 특정 표준에 맞게 조정합니다. 그뿐만 아니라, 문제 생성기를 사용하여 수집된 데이터와 과거의 결과를 바탕으로 스스로 학습하는 새로운 작업을 설계합니다.[13] 이는 비즈니스가 새로운 트렌드의 첨단을 따라가야 하는 민첩한 산업에서 특히 중요합니다. 예를 들어, 가상 비서는 고객의 요구 사항에 대해 더 많이 학습하여 서비스를 지속적으로 개선할 수 있습니다.[10] 예를 들어, 전자 상거래 사이트에서 개인화된 추천 에이전트는 사용자의 활동과 선호 사항을 메모리에서 추적하여, 사용자에게 특정 제품과 서비스를 추천하는 데 사용됩니다.[15] 또한, 지속적으로 데이터를 수집한 후 사기 패턴을 보다 효과적으로 인식하도록 조정하는 사기 탐지 시스템[37]에 활용될 수 있습니다. 사용자의 활동은 학습 목적으로, 지속적으로 저장되며, 에이전트의 정확도는 시간이 지남에 따라 향상됩니다.

계층적 에이전트(Hierarchical Agents)
계층적 에이전트는 여러 계층으로 구성된 지능형 에이전트를 조직화한 그룹으로, 다른 유형의 AI 에이전트와 많이 다릅니다. 상위 에이전트는 복잡한 작업을 작은 작업으로 분해하여 하위 에이전트에 할당합니다. 각 에이전트는 독립적으로 실행되며 자신을 감독하는 에이전트에게 진행 상황을 보고합니다.[13] 상위 에이전트는 결과를 수집하고, 하위 에이전트가 공동으로 목표를 달성할 수 있도록 하위 에이전트를 조정합니다. 이러한 구조를 통해 기업은 복잡한 다단계 프로세스를 더 간단한 작업으로 나눌 수 있게 되어, 각 AI 에이전트는 하나의 목표와 책임에 집중할 수 있습니다. 예를 들어, 첨단 제조 시스템은 계층적 에이전트를 통해 생산 라인을 조율하는데, 상위 레벨 에이전트는 시스템 전반에서 작업을 계획하고 할당하며, 하위 레벨 에이전트는 조립 작업을 위해 로봇 팔과 같은 특정 기계를 제어합니다. 각자가 서로 소통하여 원활한 생산 흐름을 보장하는 다단계 의사결정을 내릴 수 있습니다. 또한, 항공 교통의 안전하고 효율적인 흐름을 관리하기 위해 항공 교통 관제 시스템 등에도 활용할 수 있습니다.[10][37]

AI Agent 핵심 요소

AI Agent는 느슨하게 정의된 개방형 목표를 추구하기 위해 자율적으로 행동할 수 있는 AI 시스템입니다. 여기에는 계획을 세우고, '도구'를 사용하고, 실행을 위해 새로운 접근 방식을 동적으로 시도하는 것을 포함합니다. 자연어 생성 및 이해 능력을 갖춘 LLM은 시스템의 ‘두뇌’ 역할을 합니다. AI가 외부 세계와 통신하거나, 데이터를 얻거나, 특정 작업을 수행해야 하는 경우 '외부 리소스'나 ‘API’를 활용할 수 있습니다. 신중하게 구성된 질문이나 지시는 '프롬프트'로 제공되어 LLM의 행동과 인지 과정을 지시합니다.[18]

이러한 AI Agent의 토대를 구성하는 핵심 요소를 하나씩 살펴보겠습니다. 첫 번째는 '생각의 사슬(CoT, Chain-of-Thought)'*입니다.[16] '생각의 사슬 프롬프트(Chain-of-thought prompting)'라는 개념은 2022년 Google Brain 논문에서 소개되었습니다. 이 논문은 LLM이 복잡한 문제를 더 작은 중간 단계로 나눈 후, 각 단계를 연속적으로 수행하여 전체 문제를 해결할 수 있는 능력이 있음을 증명했습니다. 생각의 사슬(Chain-of-Thought) 기법은 Agent의 핵심인 LLM의 다단계 추론 및 계획 능력을 크게 향상합니다. LLM의 ‘추론(Reasoning)’과 ‘행동(Act)’ 능력의 결합에 대한 연구는 2022년 Google Brain의 'ReAct'로 중요한 개념적 기반을 마련했습니다.[6][16] * CoT(Chain-of-Thought): 복잡한 문제를 해결하기 위해 LLM이 논리적이고 순차적으로 사고하도록 장려하는 기술. 전통적인 프롬프트 방식과 달리, 모델이 각 단계에서 그 사고 과정을 평가하게 하여 오류가 발생할 경우 대안적인 방법으로 전환할 수 있게 함으로써, 더 정확하고 신뢰할 수 있는 결과 도출을 지원

두 번째는 인간의 직접적인 입력 없이 '도구'와 '메모리'를 사용하여 여러 작업을 연속으로 수행하는 것입니다. AI Agent에서 사용하는 '도구'는 프롬프트가 제공될 때 검색되고 사용되는 정보 저장소를 나타냅니다. 여기에는 LLM, 웹 사이트, 데이터베이스, 지식 기반 외부 소스 및 애플리케이션 등이 포함될 수 있습니다.[11] 외부 애플리케이션을 연결하는 '도구 사용'에 대한 연구 노력은 2023년 Meta 연구원들이 발표한 ‘Toolformer’입니다. Toolformer 팀은 캘린더 등의 외부 애플리케이션을 활용하기 위해 API 호출하는 방법과 시점을 학습하기 위해 LLM을 미세 조정했습니다. Gorilla* 및 Chain-of-Abstraction** 등은 Toolformer의 API 접근 방식을 기반으로 보다 정교한 도구를 제공하여, 향상된 Agent 동작을 가능하게 합니다. ‘메모리'는 Agent가 과거의 프롬프트와 출력을 통해 얻은 학습된 경험을 말하며, 이를 활용하여 현재 작업에 문맥적으로 더 관련된 응답을 생성할 수 있습니다. 이러한 도구와 메모리를 결합함으로써 LLM은 설정된 목표를 완료하기 위해 자율적으로 행동할 수 있는 시스템 역할을 수행합니다.[6][11] * Gorilla: LLM Connected with Massive APIs. - 사용자의 요청에 대해 적절한 API를 던져주는 모델로 정의할 수 있음. 소수의 직접 선택한 도구 대신 AI Agent가 수천 또는 수백만 개의 서로 다른 API로 구성된 동적 환경에서 선택 가능
** Chain-of-Abstraction(CoA): LLM을 더 잘 활용하기 위한 여러 방법들 중 하나로, Chain-of-Thoughts(CoT)와 같은 Chain-of-X 방법들이 많이 연구되고 있음. CoA는 외부 지식을, 도구를 사용해 통합함으로써 대규모 언어 모델(LLM)의 추론 능력을 향상하는 방법으로, 모델이 추론 과정을 추상적인 단계로 먼저 계획하고, 이후 필요한 구체적 지식을 외부 도구를 통해 채워 넣는 방식으로 이루어짐. 에이전트가 한 도구의 출력이 다른 도구의 입력에 어떻게 영향을 미칠 수 있는지 고려하는 것을 포함하여 서로 다른 도구를 조합하여 사용할 수 있는 다단계 계획 수립이 가능


마지막 구성 요소는 '멀티 에이전트 아키텍처'입니다. 인기 있는 오픈 소스 멀티 에이전트로는 LLM을 기반으로 자연어 통신을 활용하여 소프트웨어 개발 프로세스를 -설계, 코딩, 테스트 및 문서화- 통합하고 혁신하는 'ChatDev'가 있습니다.[17] ChatDev 시스템의 에이전트는 CEO, CTO, 소프트웨어 프로그래머, 소프트웨어 검토자 및 테스트 엔지니어 등의 역할을 맡습니다. 각 에이전트는 소프트웨어 애플리케이션 구축이라는 목표를 달성하기 위해 서로 협력하면서, CTO는 전체 시스템을 설계하고, 프로그래머는 코드를 생성하고, 검토자는 코드에 버그가 있는지 검사하는 데 집중합니다.

20250115_05_img [그림 5] ChatDev-채팅 체인(Chat Chain)(출처: www.unite.ai[17])

Waterfall Model

Phase-Level

  • Designing : CEO, CTO, CPO
  • Coding : CTO, Programmer, Designer
  • Testing : Programmer, Reviewer, Tester
  • Documenting : CTO, Programmer, CEO, CPO

Chat Chain

Chat-Level

  • task → instructor : CEO, assistant : CPO → modality
  • modality → instructor : CEO, assistant : CTO → language
  • language → instructor : CTO, assistant : Programmer → code
  • code → instructor : Programmer, assistant : Designer → code
  • code → instructor : Programmer, assistant : Reviewer → code
  • code → instructor : Programmer, assistant : Tester → code
  • code → instructor : CTO, assistant : Programmer → spec
  • spec → instructor : CEO, assistant : CPO → manual

AI Agent는 동일한 LLM을 통해 최종적으로 구동하는데 왜 역할을 나누고 멀티 에이전트를 구현하는 것일까요? 실제로 멀티 에이전트는 특히 복잡한 설정에서 단일 에이전트보다 더 나은 성능을 발휘합니다. 그 이유는 ‘전문화’‘모듈화’이며, 하나의 에이전트가 전체 프로젝트를 완료하는 것보다 하위의 에이전트를 활용하면 개별 작업을 더 잘 수행할 수 있습니다. 개발 관점에서도 멀티 에이전트 아키텍처는 복잡한 시스템을 독립적으로 개선/평가할 수 있는 모듈로 구성하는 점에서 유용합니다.[6][17]

AI Agent Framework

AI Agent는 기존의 강화 학습 모델보다 더 향상된 계획, 추론 및 적용 기능을 통합하는 경우가 많으며, 복잡한 작업을 위해 LLM, 도구 및 프롬프트를 결합합니다. 이러한 AI Agent를 구축하기 위해서는 LLM 호출을 오케스트레이션하고 에이전트 상태를 관리하기 위한 사전 구축된 구성 요소와 도구를 제공하는 'AI Agent Framework'가 필요합니다. Framework의 핵심 구성 요소에는 에이전트 아키텍처, 환경 인터페이스, 작업 관리, 통신 프로토콜 및 학습 메커니즘 등이 포함되며, 이를 통해 AI Agent의 구축, 배포 및 관리를 간소화하고, 개발 속도를 높이며, 표준화된 접근 방식을 활용할 수 있습니다.[18][19]

AI Agent Framework의 구성 요소는 다름과 같습니다.

  • 에이전트 아키텍처: 의사결정 프로세스, 메모리와 상호작용 기능을 포함한 AI 에이전트의 내부 조직을 정의하기 위한 구조
  • 환경 인터페이스: 에이전트를 시뮬레이션하거나 실제 운영 환경에 연결하는 도구
  • 작업 관리: 에이전트의 작업 완료를 정의, 할당 및 추적하기 위한 시스템
  • 통신 프로토콜: 에이전트 간, 에이전트와 인간 사이의 상호작용을 가능하게 하는 방법
  • 학습 메커니즘: 에이전트가 시간이 지남에 따라 성능을 개선할 수 있도록 다양한 기계 학습 알고리즘을 구현
  • 통합 도구: 에이전트를 외부 데이터 소스, API 및 기타 소프트웨어 시스템과 연결하기 위한 유틸리티
  • 모니터링 및 디버깅: 개발자가 에이전트의 동작을 관찰하고, 성능을 추적하고, 문제를 식별할 수 있는 기능

대표적인 AI Agent Framework에는 '랭체인(LangChain)', '랭그래프(LangGraph)', '크루 AI(Crew AI)', Microsoft '시맨틱 커널(Semantic Kernel)', Microsoft '오토젠(AutoGen)' 등을 꼽을 수 있습니다.[18]

LangChain은 통합과 유연성에 중점을 두고 OpenAI, Hugging Face 등의 LLM을 기반으로 에이전트를 쉽게 생성하기 위한 유연하고 직관적인 방법과 모듈식 아키텍처를 제공합니다. 해당 Framework는 긴 대화의 맥락을 유지하고, 외부 정보를 통합하며, 다단계 프로젝트를 조정하여 에이전트를 생성할 수 있습니다. LangGraph는 LangChain을 확장하여 상태 저장, 다중 액터 에이전트를 생성할 수 있으며, 에이전트 상호작용에 대한 그래프 기반 프레임워크를 제공합니다. 프로세스에 대해 추론하고, 이전 상호작용을 통해 학습하여 방법을 동적으로 수정할 수 있으며, 수많은 AI 개체가 통신, 협업 또는 경쟁할 수 있는 다중 에이전트 시스템을 생성할 수 있습니다. Crew AI는 역할 기반 AI Agent를 조정하기 위한 프레임워크로 개발자는 각각 특정 역할과 책임을 가진 AI Agent의 "크루"를 만들어 복잡한 작업을 함께 수행할 수 있습니다. 이는 인간의 조직 구조를 모방하여 복잡한 의사결정과 협업 역할 기반의 AI Agent를 만드는 데 중점을 둡니다. Microsoft의 Semantic Kernel은 LLM을 기존 애플리케이션에 통합하기 위한 강력한 도구를 제공하며, 보안 및 규정 준수 기능을 통해 중요하거나 규제된 환경에 배포하는 데 적합합니다. 이는 AI 기능으로 기존 소프트웨어 에코 시스템을 점진적으로 개선하려는 기업에 특히 유용합니다. 마지막으로, Microsoft AutoGen은 고급 대화형 AI 및 작업 완료 기능을 갖춘 정교한 멀티 에이전트를 개발하기 위한 오픈소스 Framework입니다. 지능형 에이전트 개발을 위한 표준화된 모듈식 구조를 통해 복잡한 AI Agent 개발에 대한 진입 장벽을 낮추고, 멀티 에이전트 통신 구조를 기반으로 여러 전문 Agent가 협력하여 복잡한 문제를 해결하거나 어려운 작업을 수행하는 시스템을 설계할 수 있습니다.

20250115_06_img [그림 6] AI Agent Framework(출처: www.letta.com[19])

AGENT FRAMEWORKS

Letta, LangGraph, AutoGen, LlamaIndex, crewai, DSPy, phidata, Semantic Kernel, AUTOgpt

AI Agent 시장 트렌드

마켓앤마켓에 따르면, AI Agent 시장은 2024년 51억 달러에서 2030년 471억 달러로 연평균 44.8% 성장할 것으로 예상되며[20], '자동화에 대한 수요 증가', '자연어 처리(NLP) 기술의 발전', '개인화된 고객 경험에 대한 수요 증가'는 AI Agent 시장의 성장을 주도하고 있습니다.[21]

엔터프라이즈 규모의 자동화 도구와 AI Agent 통합의 출현은 시장 성장의 핵심 동인이며, 기업은 AI Agent를 통해 다양하고 복잡한 프로세스를 자동화하고 사람의 개입을 줄여 인적 오류를 방지할 수 있습니다. 생성형 AI 기술의 근간인 자연어 처리(NLP) 기술의 발전을 기반으로 AI Agent는 인간의 언어를 이해하고 생성하는 능력이 향상되어 보다 정교하게 인간과 유사한 상호작용을 수행합니다. 또한, 복잡한 쿼리를 처리할 뿐만 아니라, 다양한 언어에 쉽게 적응할 수 있어 글로벌하게 확대할 수 있습니다. 이러한 자연어 처리 기술과 함께 'Build Your Own Agent'가 업계를 주도하고 있으며, 이를 통해 기업은 각자의 요구 사항에 맞는 맞춤형 AI Agent를 설계할 수 있습니다. 소비자는 보다 개인화된 상호작용을 기대하고, 기업은 AI Agent를 통해 데이터를 활용하여 실시간 제품 추천, 고객 지원 및 마케팅 활동을 제공함으로써 고객 만족도와 충성도를 높일 수 있습니다. 또한, 클라우드 컴퓨팅의 광범위한 채택으로 기업은 AI Agent를 더 쉽고 비용 효율적으로 배포할 수 있으며, 이러한 이점을 통해 산업 전반에 걸쳐 도입이 확대될 것입니다.[20][21]

AI Agent의 급속한 발전은 기업에 기회와 과제를 동시에 제시하고 있습니다. 기업 운영을 최적화하고 경쟁 우위를 확보하기 위한 AI Agent의 주요 시장 트렌드를 살펴보겠습니다.

(1) 생성형 AI 통합
AI Agent 개발의 가장 중요한 트렌드 중 하나는 생성형 AI를 기존 엔터프라이즈 애플리케이션에 통합하는 것입니다.[22] LLM과의 통합은 AI Agent가 모델의 방대한 지식과 처리 능력을 활용하여 인간의 언어를 더 잘 이해하고 응답할 수 있음을 의미합니다. AI Agent는 다양한 LLM의 고유 기능을 활용하여 강화됩니다. 예를 들어, GPT-4o 및 GPT 3.5는 심층적인 이해 및 생성 기능을 제공하여 복잡한 콘텐츠 생성 및 데이터 분석에 이상적이며, Gemini Pro는 텍스트, 이미지 및 음성 데이터를 원활하게 통합하여 다양한 매체에 걸쳐 포괄적인 솔루션을 제공하는 멀티모달 작업에 탁월합니다. 또한, Mixtral 8x7b는 대규모 데이터 세트를 처리하는 속도와 정밀도가 높아 빠르고 정확한 데이터 처리가 필요한 작업에 적합합니다.[7]

이러한 LLM 활용을 통해, 복잡한 쿼리를 이해하고, 자세한 답변을 제공하며, 여러 단계가 포함된 작업을 수행할 수 있는 등 보다 미묘한 상호작용이 가능합니다. AI Agent는 데이터를 분석할 뿐만 아니라 인간의 창작물과 근접한 콘텐츠를 만들 수 있게 되면서 비즈니스 운영 방식에 변화를 일으키고 있습니다. 생성형 AI 기반의 AI Agent엔터프라이즈 소프트웨어 구조에 자연스럽게 통합되고 있으며, 콘텐츠 제작, 고객 서비스 및 소프트웨어 개발 등에 유용합니다. 예를 들어, 콘텐츠 마케팅 분야에서 블로그 게시물, 소셜 미디어 업데이트 및 긴 형식의 기사를 생성하여 콘텐츠 생성 프로세스의 속도를 크게 높일 수 있습니다. 이러한 맥락에서, AI 기반 자동화는 일상적인 작업을 처리하여 효율성을 확대하고, 인간은 해당 프로세스에서 감독 역할을 맡아 미세 조정하는 등 역할의 변화를 기대할 수 있습니다.[22]

(2) 엔터프라이즈 AI의 핵심, RAG
RAG(Retrieval-Augmented Generation)는 엔터프라이즈 AI의 판도를 바꾸는 기술로 부상하고 있습니다. RAG 접근 방식은 LLM의 기능과 외부 정보 소스를 검색하고 참조하는 기능을 결합합니다. 그 결과, 더 정확하고 신뢰할 수 있으며 상황에 맞는 AI Agent를 개발할 수 있습니다. RAG는 AI 모델이 답변을 제공하기 전에 선별된 지식을 기반으로 답변에 대한 사실을 확인할 수 있는 방식으로 작동하며, 이를 통해 잘못된 정보를 생성하는 할루시네이션의 발생을 크게 줄일 수 있습니다. 기업에는 보다 신뢰할 수 있는 AI 생성 콘텐츠 및 응답을 의미하며, 법률, 의료 및 금융 서비스와 같이 정확성이 매우 중요한 산업에서 매우 유용합니다.

엔터프라이즈 환경에서 RAG를 채택하는 데에는 몇 가지 요인이 있습니다. 첫째, 지속적인 재학습이나 더 큰 모델의 개발 없이 AI 모델의 정확도를 개선할 수 있는 비용 효율적인 방법을 제공합니다. 둘째, 기존 지식과 데이터 저장소를 활용하여 AI 답변이 회사의 정보나 정책에 부합하도록 할 수 있습니다. 생성형 AI 모델의 유창함과 유연성을 선별된 기업 정보 소스의 신뢰성과 결합할 수 있는 능력은 정확성이나 관련성을 손상시키지 않으면서 AI Agent를 구현하려는 기업에 매력적인 옵션입니다.[22]

(3) 멀티모달 AI Agent
멀티모달 AI Agent는 AI 기능의 중요한 도약입니다. 이러한 고급 Agent는 이미지, 텍스트, 비디오 및 오디오 등의 다양한 유형의 데이터를 처리하고 해석하여, 정보에 입각한 결정을 내리고 작업을 더 잘 실행할 수 있습니다. 다양한 감각 입력은 에이전트의 능력을 향상하며, 여러 산업 분야에서 광범위한 응용을 가능하게 합니다. 의료 분야에서 멀티모달 AI Agent는 진단 및 환자 치료에 혁명을 일으키고 있습니다. 환자 기록 및 증상과 함께 의료 영상 데이터를 분석하여 보다 정확한 진단을 제안할 수 있습니다. 리테일 부문에서는 시각적 인식과 자연어 처리를 결합하여 보다 직관적이고 상호작용하는 쇼핑 도우미를 제공합니다. 멀티모달 AI의 잠재력은 창조적인 산업에도 유용합니다. 광고 및 디자인에서는 텍스트와 이미지를 결합한 콘텐츠를 생성하여 시각과 언어적 커뮤니케이션의 뉘앙스를 이해할 수 있습니다. 다양한 유형의 정보를 처리하고 종합하는 능력은 인간의 인지 과정을 매우 밀접하게 반영하므로 복잡한 의사결정 시나리오에서 매우 유용합니다.[22] 오픈AI 리더인 샘 알트먼과 그렉 브록먼은 단일 모델과 대화하는 대신 자신을 대신하여 작업을 수행할 수 있는 많은 멀티모달 모델과 도구로 구성된 시스템과 점점 더 상호작용하게 될 것이라고 언급하기도 했습니다.[6]

20250115_07_img [그림 7] 멀티모달 Agent(출처: aws.amazon.com[23])

Architecture Pattern : Multi-modal Agent

user : questions → Multi-modal Agent

Multi-modal Agent ← Agent Menory , Foundation model → Agent tools (text processing, computation, sentiment analysis, audio processing, visuals, customized intelligent search)

Multi-modal Agent ←→ Data Storage(tabular, audio, unstructured text, pdf files) - Multi-modal data

(4) 오픈소스 AI Agent
오픈소스는 수십 년 동안 소프트웨어 개발의 원동력이었고, AI 기술에서도 중요합니다. 오픈소스 AI 모델 및 도구는 고급 AI 기능에 대한 액세스를 민주화하여 거대 기술 기업이 독점했던 정교한 AI 기술을 소규모 기업과 개인이 활용할 수 있도록 합니다. 이러한 트렌드는 새로운 AI 비즈니스 애플리케이션에 특히 중요합니다. 이제 소규모 기업은 막대한 투자 없이도 오픈 소스 AI 라이브러리와 프레임워크를 사용하여 특정 비즈니스 요구 사항에 맞는 맞춤형 AI Agent의 신속한 프로토타이핑과 개발이 가능합니다.

또한, 오픈소스 개발의 협업적 특성은 AI 혁신을 가속화하고 있습니다. 전 세계 개발자들은 AI 모델 개선에 기여하며 더 빠른 발전과 더 다양한 애플리케이션을 이끌고 있습니다. 또한, 이러한 글로벌 협업은 ‘훈련 데이터의 편향’이나 더 효율적이면서 ‘자원 집약도가 낮은 모델에 대한 요구’ 등의 AI 과제 해결에 도움이 되고 있습니다. 오픈소스 AI가 계속 발전함에 따라, 특정 산업 및 사용 사례에 맞게 설계된 전문 AI 도구와 모델이 확대될 것이며, 의료에서부터 교육, 환경 보전에 이르기까지 다양한 부문에 적용될 것입니다.[22]

(5) 자율 AI Agent
특정 입력에 대한 반응형 AI 시스템과 달리 에이전트 AI(agentic AI)는 일정 수준의 자율성과 능동성을 보여줍니다. 자율 AI Agent는 인간의 개입을 최소화하면서 작동하도록 진화하고 있습니다. 의사결정에서 문제 해결에 이르기까지 복잡한 작업을 관리하도록 설계되어, 자체 목표를 설정하고, 결정을 내리며, 이러한 목표를 달성하기 위해 독립적으로 조치를 취할 수 있습니다.[22] 자율 Agent는 데이터를 사용해 학습하고, 새로운 상황에 적응하고, 사람의 개입이 거의 없이 의사결정을 내릴 수 있습니다. 즉, 이러한 자율성은 기계 학습, 자연어 처리 및 상황 인식 의사결정의 발전에 의해 구동됩니다.

기업은 자율 AI Agent를 활용하여 다단계 워크플로우를 자동화하고 운영을 효율화할 수 있습니다. 사이버 보안 측면에서는 네트워크를 모니터링하고 보안하는 데 중요한 역할을 하며, 사람의 개입 없이 위협을 무력화하기 위한 실시간 결정을 내릴 수 있습니다.[7] 또한, 연구 개발 과정에서는 실험을 설계 및 실행하고, 결과를 분석하며, 새로운 가설을 수립할 수 있어 잠재적으로 과학적 발견을 가속할 수 있습니다. AI Agent의 자율성이 커짐에 따라, 인간의 가치에 부합하고 윤리적 경계 내에서 작동하도록 하는 것이 매우 중요해지고 있습니다.[22]

(6) 특정 비즈니스에 특화된 엔터프라이즈 AI Agent
기업이 AI 기능에 익숙해짐에 따라, 산업 및 특정 비즈니스 기능에 특화된 생성형 AI 모델이 증가하고 있습니다. 이러한 도메인별 모델은 'GPT-4'와 같은 대규모 모델보다 훨씬 작으며, 오픈소스 모델의 가용성이 증가함에 따라 수요가 확대되고 있습니다. 엔터프라이즈 생성형 AI의 미래는 애플리케이션과 업종별 소프트웨어의 진화에 크게 좌우됩니다. 기업은 범용적인 AI 모델에 의존하는 대신 고유한 요구 사항, 데이터 및 산업 컨텍스트를 이해할 수 있는 모델을 개발하거나 미세 조정에 투자하고 있습니다.

이러한 추세는 몇 가지 요인에 의해 기인합니다. 기업은 업계의 전문 용어 및 프로세스를 이해하고 작동하는 AI 모델이 필요합니다. 예를 들어, 법률 회사는 법률 텍스트 및 판례에 대해 훈련된 AI 모델을 개발하여, 계약서를 작성하고 검토할 수 있습니다. 범용 모델은 상당한 컴퓨팅 리소스가 필요한 경우가 많지만, 좁게 타겟팅된 모델은 더 작고 효율적이므로 운영 비용을 절감하고 특정 도메인에서 고품질 결과를 제공할 수 있습니다. 이러한 맞춤형 모델의 개발은 전이 학습 기술 덕분에 접근이 쉬워지고 있습니다. 기업은 사전 훈련된 모델을 기반으로 독점 데이터를 통해 미세 조정하므로 전문 AI 애플리케이션을 개발하는 데 필요한 시간과 리소스를 크게 줄일 수 있습니다. 이러한 추세가 지속됨에 따라, 다양한 산업 분야에서 고도로 전문화된 AI Agent가 급증할 것으로 보이며, 각 Agent는 높은 수준의 정확성과 효율성으로 특정 작업을 수행할 것입니다.[22]

(7) 멀티 에이전트 시스템(MAS, Multi-Agent System)
기업이 생성형 AI의 가치를 추구함에 따라, 워크플로우와 비즈니스 프로세스를 자동화하는 멀티 에이전트 시스템이 자리를 잡아가고 있습니다. 독립적으로 작동하는 단일 AI 에이전트와 달리, 멀티 에이전트 시스템은 여러 지능형 에이전트가 함께 작동하여 각각의 특정 작업을 처리하므로 전반적인 효율성과 문제 해결 능력이 향상됩니다. MAS는 해당 환경에서 다른 에이전트의 동작을 이해하고 예측하는 것이 중요합니다. 이는 에이전트 자신의 상태뿐만 아니라 다른 에이전트와의 상호작용으로 인해 발생하는 역동성을 포착하는 데 있어 모델의 역할을 강조합니다.[7]

멀티 에이전트 시스템은 '오케스트라'로 비유할 수 있습니다. 수석 지휘자를 통해, 일련의 다른 지휘자 또는 하위 에이전트에게 작업을 할당할 수 있습니다. 사용자는 프롬프트 창 등의 사용자 인터페이스를 통해 쿼리하고, 이는 각 하위 에이전트가 작업을 처리하는 체인 이벤트를 시작시킵니다. 에이전트는 디지털 도구, 시스템 및 인간과 협업하고, 기업 데이터를 활용하여 고유한 전문 지식을 얻을 수 있으며[25], 여러 에이전트의 집단 지능을 활용하여 정확한 의사결정을 내릴 수 있습니다. 또한, 여러 에이전트에 작업을 분산하여 워크로드를 효율적으로 관리하고. 더 크고 복잡한 작업을 처리하도록 시스템을 확장할 수 있으며, 에이전트에 장애가 발생하면 다른 에이전트가 원활하게 인계받아 신뢰할 수 있는 시스템을 제공할 수 있습니다. 더욱 중요한 것은, 멀티 에이전트 시스템이 작업 기록, 사람의 피드백 및 기타 입력을 통해 학습하여 정기적으로 성능을 개선하고 환경 변화에 적응하는 것이며, 이는 끊임없이 변화하는 비즈니스 환경에서 매우 중요합니다.[7]

멀티 에이전트는 단일 에이전트에 비해 다양한 아키텍처로 구성됩니다.[26] 'Network' 방식은 각 에이전트가 다른 모든 에이전트와 통신할 수 있으며, 모든 에이전트는 다음에 호출할 다른 에이전트를 결정할 수 있습니다. 'Supervisor' 방식은 각 에이전트가 단일 수퍼바이저 에이전트와 통신하며, 수퍼바이저 에이전트는 다음에 어떤 에이전트를 호출해야 하는지 결정합니다. 'Hierarchical' 방식은 수퍼바이저의 수퍼바이저가 있는 다중 에이전트 시스템을 정의할 수 있습니다. 이는, 수퍼바이저 아키텍처를 일반화한 것이며 더 복잡한 제어 흐름을 허용합니다. 'Custom' 방식의 경우, 각 에이전트는 에이전트의 하위 집합과만 통신합니다. 흐름의 일부는 결정적이며, 일부 에이전트만 다음에 호출할 다른 에이전트를 결정할 수 있습니다.

20250115_08_img [그림 8] 멀티 에이전트 아키텍처(출처: langchain-ai.github.io[26])
  • Single Agent : LLM 과 Tools 가 서로 상호작용
  • Network : Agent 끼리 서로 상호작용
  • Supervisor : 하나의 Agent 를 기준으로 여러 Agent 와 상호작용
  • Supervisor(as tools) : LLM 과 여러 에이전트가 상호작용
  • Hierarchical : 하나의 Agent 를 기준으로 여러 Agent 그룹과 상호작용
  • Custom : 원하는 대로 연결된 Agent 끼리 상호작용

이러한, 멀티 에이전트는 운영 생산성을 높일 수 있는 유망한 솔루션으로, 자동화하기 어려웠던 사용 사례를 자동화할 수 있는 잠재력을 가지고 있습니다. 예를 들어, 물류 분야에서는 한 에이전트를 통해 재고를 관리하고, 다른 에이전트를 통해 최적 경로를 계획하며, 또 다른 에이전트로 실시간 배송 조건을 모니터링하여 멀티 에이전트 공급망 운영을 수행할 수 있습니다. 다만, 이러한 복잡한 멀티 에이전트를 구동하는 것 역시 생성형 AI이기 때문에 동일한 위험 요소를 가지고 있습니다. 일반적인 보안 가드레일 외에도, 동료 에이전트에게 에이전트의 작업을 평가하도록 요청하거나, 원래의 응답을 검증하기 위해 적대적 에이전트를 사용하여 다른 결과를 생성한 후 두 개의 결과를 비교할 수도 있습니다. 기업은 에이전트가 의도한 대로 수행되는지 확인하는 방법에 대해서도 반드시 고려해야 합니다. 또한, 에이전트가 할 수 있는 일의 범위를 제한하는 방식으로 설정하여 인간을 루프에 포함(Human-in-the-loop) 시킬 수 있습니다.[5]

(8) 개인화된 AI Agent
개인화된 에이전트는 개인의 행동과 선호도에 따라 상호작용을 맞춤화하여 사용자 경험을 혁신하고 있습니다. 이러한 변화는 데이터 분석, 머신러닝 및 행동 인사이트 통합의 발전에 기인하며, 이를 통해 AI 에이전트는 사용자 요구 사항을 보다 정확하게 이해하고 예측할 수 있습니다.

데이터 분석을 활용하여 방대한 양의 사용자 데이터를 수집하고, 머신러닝 알고리즘을 사용하여 사용자 행동의 패턴과 추세를 분석한 후 상호작용을 맞춤화할 수 있으며, 행동 인사이트는 에이전트가 사용자의 어조, 맥락 및 과거 상호작용 등을 기반으로 응답을 조정할 수 있도록 하기 때문에 프로세스에서 중요한 역할을 합니다. 예를 들어, 리테일 부문에서는 개인화된 에이전트를 사용하여 개인의 취향과 구매 내역에 맞는 추천을 제공하는 맞춤형 쇼핑 경험을 제공하고 있습니다. 이러한 초 개인화된 에이전트는 관련성 있고 시기적절한 정보를 제공하여 사용자 만족도와 충성도를 높이고, 사용자는 자신의 필요와 선호도를 이해하는 서비스를 선택할 수 있습니다.[7]

(9) 비즈니스 운영의 AI Agent
에이전트는 프로세스를 간소화하고, 비용을 최적화하며, 다양한 부문에서 비즈니스 운영을 혁신하는 데 중추적인 역할을 하고 있습니다. AI Agent를 비즈니스 워크플로우에 통합하는 것은 단순한 트렌드가 아니라 필연적인 과정이며, 기업은 변화하는 시장에서 경쟁력을 유지할 수 있습니다.[7]

기업은 기술이 성숙해짐에 따라, 기본적인 자동화에 인텔리전스를 적용하는 데 초점을 맞추고 있습니다. 이것은 더 복잡한 비즈니스 요구 사항을 지원하는 지능형 시스템으로의 변화를 나타냅니다. RPA(Robotic Process Automation) 및 데이터 엔지니어링 등의 기술은 많은 기업에 도입되어 반복적인 작업을 자동화하고 비즈니스 운영의 일반적인 부분이 되었습니다. 이러한 기능을 더 광범위하고 상호 연결된 AI 시스템에 통합하고, 인텔리전스를 추가하여 RPA를 단순한 작업 자동화 도구에서 더 복잡한 의사결정 AI 내의 구성 요소로 전환하게 될 것입니다. 이러한 변화는 작업을 실행하고, 학습하고, 적응하고, 심지어 담당자와 협업하고 인간의 능력을 확장하는 ‘지능형 자동화’의 부상을 뜻합니다.[27]

(10) 엣지 컴퓨팅(Edge Computing)에서의 AI
AI Agent와 엣지 컴퓨팅의 통합은 일상생활에서 AI와 상호작용하는 방식을 재편할 것입니다.[22] 자율 에이전트 시대에는 더 가까운 데이터 소스를 기반으로 신속한 처리가 필요합니다. 생성형 AI가 더 많은 장치에 내장됨에 따라, 실시간 데이터를 기반으로 자율적인 의사결정을 수행하고 과도한 클라우드 비용을 절감해야 하는데, 이것이 바로 엣지 컴퓨팅이 필요한 이유입니다.[28] 엣지 컴퓨팅은 데이터 저장소와 계산을 수천 마일 떨어진 중앙에서 처리하는 대신, 데이터가 수집되는 장치 가까이로 가져옵니다. 엣지 컴퓨팅을 AI와 결합하면 더 빠르고 효율적이며 안정적인 AI 기반 애플리케이션을 구현할 수 있습니다.

AI 에이전트의 맥락에서 엣지 컴퓨팅은 실시간 처리 및 의사결정을 가능하게 하며, 이는 자율 주행 차량, 스마트 홈 장치 및 산업용 IoT 센서 등의 애플리케이션에서 매우 중요합니다. 예를 들어, 자율 주행 자동차의 AI 에이전트는 원격 서버로 데이터를 보내고 응답을 기다릴 필요 없이 즉각적인 환경 데이터를 기반으로 빠르게 결정할 수 있습니다. 이러한 방식은 민감한 데이터를 클라우드로 전송하지 않고 로컬에서 처리할 수 있기 때문에 AI와 관련된 개인 정보 보호나 보안 문제의 일부를 해결합니다. 또한, 대기 시간과 대역폭 사용량을 줄여 AI 애플리케이션의 응답 속도를 높이고 네트워크 연결에 대한 의존도를 낮춥니다. 엣지 AI가 발전함에 따라, 스마트폰부터 가전제품에 이르기까지 일상적인 장치에 더욱 정교한 AI 에이전트가 내장될 것으로 예상됩니다. 이를 통해, 인터넷 연결이 제한적인 환경에서도 효과적으로 작동할 수 있는 보다 개인화된 AI 비서를 확보할 수 있습니다.[22]

20250115_09_img [그림 9] Cloud AI vs. Edge AI(출처: www.akamai.com[29])

Cloud AI

Computation takes place here → car, cctv, phone, blinker

Edge AI

Edge Server (Computation takes place here) → car, cctv, phone, blinker

What is the difference between cloud AI and edge AI?



☞ 2편에서는 AI Agent의 비즈니스 가치 창출과 기업의 도입 전략에 대해 살펴보도록 하겠습니다.

References
[1] https://www.zdnet.com/article/agentic-ai-is-the-top-strategic-technology-trend-for-2025/
[2] https://www.dubaichronicle.com/2024/11/20/top-10-strategic-technology-trends-new/
[3] https://botpress.com/blog/top-artificial-intelligence-trends
[4] https://www.forbes.com/councils/forbesbusinesscouncil/2024/10/01/the-rise-of-ai-agents-unlocking-their-full-potential/
[5] https://www.cio.com/article/3489045/ai-agents-will-transform-business-processes-and-magnify-risks.html
[6] https://www.forbes.com/sites/robtoews/2024/07/09/agents-are-the-future-of-ai-where-are-the-startup-opportunities/
[7] https://blog.getodin.ai/ai-agents-in-2024-trends-tech-enthusiasts-should-watch/
[8] https://www.pega.com/agentic-ai?utm_source=google&utm_medium=cpc&utm_campaign=G_APAC_NonBrand_AI_CE_Exact_(CPN-111067)_EN&utm_term=autonomous%20ai%20agents&gloc=9195713&utm_content=pcrid%7C720004649719%7Cpkw%7Ckwd-2014509039311%7Cpmt%7Ce%7Cpdv%7Cc%7C&gad_source=5&gclid=EAIaIQobChMIhpLv6NHYiQMVyv1MAh2AtAPNEAAYAyAAEgIMSvD_BwE&gclsrc=aw.ds
[9] https://indatalabs.com/blog/ai-agents-examples
[10] https://www.salesforce.com/ap/agentforce/what-are-ai-agents/
[11] https://shelf.io/blog/the-evolution-of-ai-introducing-autonomous-ai-agents/
[12] https://markovate.com/blog/agentic-ai-architecture/
[13] https://aws.amazon.com/ko/what-is/ai-agents/
[14] https://www.magicaiprompts.com/docs/ai-agent/what-is-ai-agent/
[15] https://www.ibm.com/kr-ko/think/topics/ai-agents
[16] https://blog.naver.com/mr10002/223385305223
[17] https://www.unite.ai/ko/chatdev-communicative-agents-for-software-development/
[18] https://www.analyticsvidhya.com/blog/2024/07/ai-agent-frameworks/
[19] https://www.letta.com/blog/ai-agents-stack
[20] https://www.marketsandmarkets.com/Market-Reports/ai-agents-market-15761548.html?gad_source=1&gclid=EAIaIQobChMImPrxt_zkiQMV3tEWBR25GS5oEAAYAiAAEgIQBfD_BwE
[21] https://www.grandviewresearch.com/industry-analysis/ai-agents-market-report
[22] https://www.justthink.ai/blog/the-top-ai-agent-trends-to-watch
[23] https://aws.amazon.com/ko/blogs/machine-learning/generative-ai-and-multi-modal-agents-in-aws-the-key-to-unlocking-new-value-in-financial-markets
[24] https://www.softwebsolutions.com/resources/autonomous-ai-agents
[25] https://www.cio.com/article/3488553/ai-agents-loom-large-as-organizations-pursue-generative-ai-value.html
[26] https://langchain-ai.github.io/langgraph/concepts/multi_agent/#multi-agent-architectures
[27] https://blog.getaura.ai/ai-agents-skills-data-trends
[28] https://www.cio.com/article/3563765/ai-makes-edge-computing-more-relevant-to-cios.html
[29] https://www.akamai.com/glossary/what-is-ai-on-edge-networks
[30] https://autogpt.net/state-of-ai-agents-in-2024/
[31] https://smythos.com/artificial-intelligence/autonomous-agents/future-of-autonomous-agents/
[32] https://www.norm.ai/platform
[33] https://www.greenlite.ai/
[34] https://agilayer.com/ai-agent-projects-2024-themes-trends-and-opportunities/
[35] https://beyondx.ai/mulryurobos-canggoreul-deo-ddogddoghage-meolti-eijeonteu-okeseuteureisyeoneul-wihan-haegsim-gineunge-daehae/
[36] https://www.dhl.com/discover/en-global/logistics-advice/logistics-insights/ai-in-logistics-and-last-mile-delivery
[37] https://botpress.com/ko/blog/real-world-applications-of-ai-agents

이 글이 좋으셨다면 구독&좋아요

여러분의 “구독”과 “좋아요”는
저자에게 큰 힘이 됩니다.

subscribe

구독하기

subscribe

홍은주
홍은주

삼성SDS 전략마케팅팀

IT 동향 분석, 프로세스 혁신 및 경영전략 수립의 컨설팅 업무 경험을 기반으로, 삼성SDS 닷컴 내 Digital Transformation 및 솔루션 페이지 기획/운영 업무를 수행하였고 SDS 주요 사업영역별 동향/솔루션 분석을 통한 컨텐츠 기획 및 마케팅을 수행하고 있습니다.

공유하기