본문 바로가기

KPMG Future Academy 6기

(삼정 KPMG future academy 6기 수업) AI agent

 

(참고자료)

삼정KPMG-AI에이전트-20250908 (1).pdf
19.50MB

 

https://www.ibm.com/kr-ko/think/topics/ai-agents

https://huggingface.co/learn/agents-course/unit0/introduction

 

 

1. AI agent 발전 단계 - 젠슨 황

인지 AI (Perception AI) - 생성 AI (Generative AI) - 에이전트 AI (Agentic AI) - 물리적 AI (Physical AI)

  • 1→2단계: 인식에서 생성으로 (정보 → 창작)
  • 2→3단계: 생성에서 자율로 (창작 → 행동)
  • 3→4단계: 디지털에서 물리로 (가상 → 현실)
단계 명칭 중심 기능 특징 요약
1 인지 AI
(Perception AI)
이미지·음성·센서 데이터를 인식하고 이해하는 기술 (예: 얼굴 인식, 음성 인식) 세상을 ‘보는’ 단계로, 데이터 수집과 인식 기술 중심.
AI의 기초 인프라 단계.
2 생성 AI
(Generative AI)
텍스트, 이미지, 음성 등 새로운 콘텐츠 생성
(예: ChatGPT, DALL·E)
창작과 표현 중심. 디지털 콘텐츠 생산 혁신.
산업 전반에 AI 활용이 확산됨.
3 에이전트 AI
(Agentic AI)
스스로 목표를 설정하고 계획·행동·
피드백을 수행하는 자율형 AI
사용자의 지시 없이도 문제를 해결하고 의사결정을 수행.
업무 자동화·디지털 비서 등에서 활용.
4 물리적 AI
(Physical AI)
로봇·자율주행 등 물리 세계에서
인지·판단·행동하는 AI
현실 공간에서 인간과 협력·대체하는 단계. 산업용 로봇,
자율차 등 현실 응용의 완성형.

 

 

2. 언어 모델 변천

  • 통계적 언어모델(Statistical Language Model, 1990s) :
    단어 간 단순 확률 관계만 학습 → 문맥 이해 한계
  • 신경 언어모델 (Neural Language Model, ~2013) :
    단어를 벡터로 바꿔서 가장 가까운 언어로 의미 파악, 전체적인 문맥 보다는 단어수준의 의미에 초점
  • 사전학습 언어모델 (Pre-trained Language Model, 2018~) :
    문맥(Context) 이해 가능, 다수의 NLP 과제에 응용, 대규모 텍스트 데이터로 사전 학습(pre-training) 후, 특정 태스크에 파인튜닝(fine-tuning) - 번역, 질의응담, 감성분석, 문장 요약 등의 작업 수헹 가능
  • 대규모 언어모델 (Large Language Model, 2020~) :
    특정 태스크에 의존하지 않음 → 범용적 언어 이해 및 생성 능력, 실세계 응용 (챗봇, 코딩, 요약, 문서 작성 등) 가능

 

3. AI  Agent의 기원과 변천

 

3-1. Chain-of-Thought(CoT) 프롬프팅 : 생각의 과정(Reasoning)만!

 

  • 정의:
    LLM에게 단순히 “정답만 말해”가 아니라, “생각의 과정(추론 단계)”을 하나씩 설명하도록 유도하는 프롬프트 기법
  • 핵심 아이디어:
    예를 들어, 문제를 풀 때 사람처럼 “이건 이렇게 계산하고 → 다음은 이렇게 생각해서 → 그러니까 답은 이것이야”
    라는 식으로 단계별 추론 과정을 거치게 만드는 방식
  • 효과:
    2022년 논문에서 확인되었듯이, “단계별 사고(Let’s think step by step)” 문장을 추가했을 때
    복잡한 수리·논리 문제의 정답률이 크게 향상됨.

 

3-2. ReAct (Reasoning + Acting) : 사고 + 행동 + 관찰 + 재추론

  • 정의:
    LLM이 추론(Reasoning) 능력과 행동(Acting) 능력을 결합해 단순 텍스트 생성이 아니라 실제 태스크를 수행하도록 만든 프레임워크, AI가 “생각만 하는 모델”에서 벗어나, 생각하며 행동하는 에이전트(AI Agent)로 발전하게 한 개념
  • 핵심 아이디어:
    CoT(Chain-of-Thought)가 단계별 사고 과정을 보여주는 데 그쳤다면, ReAct는 “생각 → 행동 → 관찰 → 재추론”의 순환 과정 가능. LLM이 스스로 정보를 검색하고, 행동 결과를 해석하며, 그 결과를 바탕으로 다음 행동을 계획할 수 있도록 설계됨.
    즉, Reasoning(논리적 사고) 과 Acting(도구 활용, 외부 상호작용)을 통합한 구조
  • 효과:
    • 복합적 목표 수행 능력 향상: 단순 질의응답을 넘어 실제 환경과 상호작용하며 문제 해결 가능.
    • 정확도 개선: CoT나 단일 행동 모델보다 논리적이고 검증된 답 도출.
    • AI Agent 발전의 기초: 이후 AutoGPT, LangChain, GPTs 등의 자율형 AI 시스템의 기반이 된 핵심 프레임워크.

 

4. AI agent 정의

 

(요약)

① 정의
  • 에이전트(Agent) = 목표를 달성하기 위해 환경을 인식하고, 도구를 사용해 행동하는 자율적 시스템
  • 기존 LLM이 단순히 입력 → 출력에 그쳤다면, 에이전트는 목표 지향적 사고, 추론, 행동 계획을 수행함.
② 핵심 구성요소
  1. Model (모델)
    • 의사결정의 중심. LLM을 활용해 추론(Reasoning), 논리(Logic) 수행
    • ReAct, CoT(Chain-of-Thought), ToT(Tree-of-Thought) 등 다양한 사고 프레임워크를 사용
  2. Tools (도구)
    • 외부 데이터·API·시스템과 연결하여 실제 행동 수행
    • 세 가지 유형
      • Extensions: API 호출을 직접 수행
      • Functions: 클라이언트 측에서 실행 (보안/비동기 처리 유리)
      • Data Stores: 최신 데이터 접근·검색 (RAG 기반)
  3. Orchestration Layer (오케스트레이션 계층)
    • 입력 → 추론 → 행동 → 피드백의 루프를 관리
    • 메모리, 상태, 의사결정, 계획 수립 담당
③ Agent vs. Model
 
④ 핵심 아이디어
  • “도구 사용이 곧 에이전트의 지능”
모델이 외부 세상과 연결될 때 비로소 **실행 가능한 지능(Acting Intelligence)**이 된다.


 

 

  • 사용자 유저 쿼리 입력 - 목표에 맞는 답변 생성 (오케스트레이션 + 모델 + Tool)
  • 오케스트레이션 : 지휘자 역할, 어떤 도구 사용할지, 모듈과 연결하여 전체적으로 조율
  • Model based Reasoning/ Planning : 문제 단계적으로 분석하고 실행계획을 세움 
  • Tool 예시 : 날씨 API,  이메일 gamil api, 검색엔진, 계산기, 코드생성기 등등
  • 사용자 유저 쿼리 입력 - 오케스트레이션이 목적 파악(메모리 참고해서) 후 문제 풀기위한 계획을 수립, 필요한 경우 Tool 사용, 마지막으로 LLM 모델이 결과 생성 수 반환
  •  Model : 생각하고 말하는 두뇌
  • Memory : 장기메모리, 단기메모리 왜 나눌까? 무슨 기준으로 나눌까?
     - 문맥을 파악하는 것은 단기 메모리, 장기메모리는 과거 학습된 데이터를 가져온다.

 

5. Agent companion

[참고]Agents_Companion_v2.pdf
10.58MB

(요약)

① 개요
  • 단순 개념에서 실제 운영 단계로 발전
  • “Proof of Concept → Production” 전환을 위한 운영 프레임워크와 평가 지표 제시
② AgentOps (운영 프레임워크)
  • DevOps → MLOps → FMOps → AgentOps로 진화
  • AgentOps 구성요소
    • 내부/외부 도구 관리
    • 프롬프트 구조(Goal, Profile, Instruction)
    • 메모리·오케스트레이션 관리
    • 태스크 분해(Task Decomposition)
③ Agent Evaluation (평가 프레임워크)
  1. Capabilities — 이해력·추론력·툴 선택 능력 평가
    • 예: BFCL(도구 호출 정확도), PlanBench(계획능력), AgentBench(종합 시뮬레이션)
  2. Trajectory & Tool Use — 행동 경로 비교
    • 평가 지표: Exact Match, Precision, Recall 등
  3. Final Response — 결과물의 품질, 정확성, 맥락성 평가
    • LLM-as-a-Judge(자동 채점) 활용
  4. Human-in-the-Loop — 인간 피드백으로 평가 신뢰도 보완
④ Multi-Agent System (멀티에이전트)
  • 다수의 에이전트가 협력하여 복잡한 목표 달성
  • 패턴 유형
    • Hierarchical (상하 구조)
    • Diamond / Collaborative / Peer-to-Peer
  • 장점: 효율성, 확장성, 정확도, 오류 복원력, 편향 감소
  • 도전과제: 통신 복잡성, 문맥 관리, 시간·비용 부담
⑤ Agentic RAG
  • 기존 RAG의 정적 검색 한계를 넘어, 에이전트 기반 검색-평가-통합으로 진화
  • 특징
    • Query Refinement (문맥 기반 검색 확장)
    • Multi-step Reasoning (복합 쿼리 분해)
    • Adaptive Source Selection (동적 데이터 선택)
    • Validation Agents (지식 검증 및 오류 교정)
⑥ Enterprise 적용
  • Assistant Agents: 사용자와 상호작용 (예: 일정, 리서치, 작성 지원)
  • Automation Agents: 백그라운드 자동화 (시스템 감시, 이벤트 처리)
  • Google Agentspace: 다수의 에이전트를 생성·관리·모니터링하는 플랫폼
보안(SSO, RBAC, VPC), 데이터 통합, 커스터마이징 지원

 

  • 에이전트 평가 방법 : 에이전트가 어떻게 사고하고 행동했는지 평가
  • DevOps : 개발(Development)과 운영(Operations)을 결합한 개념
  • MLOps : 머신러닝(ML) 모델의 개발, 배포, 운영을 자동화하고 효율적으로 관리하는 ML 전용 DevOps
  • FMOps : 대규모 사전학습 언어모델(LLM)이나 멀티모달 모델 등 Foundation Model의 전 과정
    (학습, 미세조정, 배포, 모니터링)을 안정적이고 지속적으로 관리하기 위한 운영 체계)
     
  • 멀티 에이전트 : 여러 개의 AI 에이전트가 서로 다른 역할을 수행하면서 공동 목표를 달성하는 시스템 구조.
    • 계층형 : 상위 에이전트가 하위 에이전트를 관리, 감독, 명령–수행 구조
    • 다이아몬드형 : 여러가지 에이전트가 병렬로 통합해서..
    • 동료간: 에이전트들이 동등한 위치에서 서로 협력하며 문제를 해결, 
    • 협력형 : 여러 에이전트가 공유 목표를 위해 역할을 분담하고 협력적으로 작동

 

 

실습 - n8n 활용

(https://n8n.io/?ps_partner_key=ZDQzNGI4ZGMyYWI0&ps_xid=0WY7xGVpem7c5h&gsxid=0WY7xGVpem7c5h&gspk=ZDQzNGI4ZGMyYWI0&gad_source=1&gad_campaignid=23060578744&gbraid=0AAAAA-RhEmyPZPW-lBKdDDIU-PUZPTZDC&gclid=CjwKCAjwmNLHBhA4EiwA3ts3mX_pX2CQcx4WCIp24sx8h8_ScKSIDwnXl9PjigtjMvdnZTqxYBLhiBoCUvoQAvD_BwE)

 

- 로컬기반 설치 사용은 무료

GitHub - n8n-io/n8n: Fair-code workflow automation platform with native AI capabilities. Combine visual building with custom code, self-host or cloud, 400+ integrations.

 

GitHub - n8n-io/n8n: Fair-code workflow automation platform with native AI capabilities. Combine visual building with custom cod

Fair-code workflow automation platform with native AI capabilities. Combine visual building with custom code, self-host or cloud, 400+ integrations. - n8n-io/n8n

github.com

ex) 네이버 블로그 맛집 검색 api 연결 agent

 

* cmd 에서 n8n 설치 후 로컬 주소 get -> 네이버 개발자 - application  - api 정보를 HTTP request에 입력

 

 

 

 

(참고)

 

 

6.  Model