
(참고자료)
https://www.ibm.com/kr-ko/think/topics/ai-agents
https://huggingface.co/learn/agents-course/unit0/introduction
1. AI agent 발전 단계 - 젠슨 황
인지 AI (Perception AI) - 생성 AI (Generative AI) - 에이전트 AI (Agentic AI) - 물리적 AI (Physical AI)
- 1→2단계: 인식에서 생성으로 (정보 → 창작)
- 2→3단계: 생성에서 자율로 (창작 → 행동)
- 3→4단계: 디지털에서 물리로 (가상 → 현실)
| 단계 | 명칭 | 중심 기능 | 특징 요약 |
| 1 | 인지 AI (Perception AI) |
이미지·음성·센서 데이터를 인식하고 이해하는 기술 (예: 얼굴 인식, 음성 인식) | 세상을 ‘보는’ 단계로, 데이터 수집과 인식 기술 중심. AI의 기초 인프라 단계. |
| 2 | 생성 AI (Generative AI) |
텍스트, 이미지, 음성 등 새로운 콘텐츠 생성 (예: ChatGPT, DALL·E) |
창작과 표현 중심. 디지털 콘텐츠 생산 혁신. 산업 전반에 AI 활용이 확산됨. |
| 3 | 에이전트 AI (Agentic AI) |
스스로 목표를 설정하고 계획·행동· 피드백을 수행하는 자율형 AI |
사용자의 지시 없이도 문제를 해결하고 의사결정을 수행. 업무 자동화·디지털 비서 등에서 활용. |
| 4 | 물리적 AI (Physical AI) |
로봇·자율주행 등 물리 세계에서 인지·판단·행동하는 AI |
현실 공간에서 인간과 협력·대체하는 단계. 산업용 로봇, 자율차 등 현실 응용의 완성형. |


2. 언어 모델 변천
- 통계적 언어모델(Statistical Language Model, 1990s) :
단어 간 단순 확률 관계만 학습 → 문맥 이해 한계 - 신경 언어모델 (Neural Language Model, ~2013) :
단어를 벡터로 바꿔서 가장 가까운 언어로 의미 파악, 전체적인 문맥 보다는 단어수준의 의미에 초점 - 사전학습 언어모델 (Pre-trained Language Model, 2018~) :
문맥(Context) 이해 가능, 다수의 NLP 과제에 응용, 대규모 텍스트 데이터로 사전 학습(pre-training) 후, 특정 태스크에 파인튜닝(fine-tuning) - 번역, 질의응담, 감성분석, 문장 요약 등의 작업 수헹 가능 - 대규모 언어모델 (Large Language Model, 2020~) :
특정 태스크에 의존하지 않음 → 범용적 언어 이해 및 생성 능력, 실세계 응용 (챗봇, 코딩, 요약, 문서 작성 등) 가능
3. AI Agent의 기원과 변천
3-1. Chain-of-Thought(CoT) 프롬프팅 : 생각의 과정(Reasoning)만!
- 정의:
LLM에게 단순히 “정답만 말해”가 아니라, “생각의 과정(추론 단계)”을 하나씩 설명하도록 유도하는 프롬프트 기법 - 핵심 아이디어:
예를 들어, 문제를 풀 때 사람처럼 “이건 이렇게 계산하고 → 다음은 이렇게 생각해서 → 그러니까 답은 이것이야”
라는 식으로 단계별 추론 과정을 거치게 만드는 방식 - 효과:
2022년 논문에서 확인되었듯이, “단계별 사고(Let’s think step by step)” 문장을 추가했을 때
복잡한 수리·논리 문제의 정답률이 크게 향상됨.

3-2. ReAct (Reasoning + Acting) : 사고 + 행동 + 관찰 + 재추론
- 정의:
LLM이 추론(Reasoning) 능력과 행동(Acting) 능력을 결합해 단순 텍스트 생성이 아니라 실제 태스크를 수행하도록 만든 프레임워크, AI가 “생각만 하는 모델”에서 벗어나, 생각하며 행동하는 에이전트(AI Agent)로 발전하게 한 개념 - 핵심 아이디어:
CoT(Chain-of-Thought)가 단계별 사고 과정을 보여주는 데 그쳤다면, ReAct는 “생각 → 행동 → 관찰 → 재추론”의 순환 과정 가능. LLM이 스스로 정보를 검색하고, 행동 결과를 해석하며, 그 결과를 바탕으로 다음 행동을 계획할 수 있도록 설계됨.
즉, Reasoning(논리적 사고) 과 Acting(도구 활용, 외부 상호작용)을 통합한 구조 - 효과:
- 복합적 목표 수행 능력 향상: 단순 질의응답을 넘어 실제 환경과 상호작용하며 문제 해결 가능.
- 정확도 개선: CoT나 단일 행동 모델보다 논리적이고 검증된 답 도출.
- AI Agent 발전의 기초: 이후 AutoGPT, LangChain, GPTs 등의 자율형 AI 시스템의 기반이 된 핵심 프레임워크.

4. AI agent 정의
| (요약) ① 정의
|

- 사용자 유저 쿼리 입력 - 목표에 맞는 답변 생성 (오케스트레이션 + 모델 + Tool)
- 오케스트레이션 : 지휘자 역할, 어떤 도구 사용할지, 모듈과 연결하여 전체적으로 조율
- Model based Reasoning/ Planning : 문제 단계적으로 분석하고 실행계획을 세움
- Tool 예시 : 날씨 API, 이메일 gamil api, 검색엔진, 계산기, 코드생성기 등등
- 사용자 유저 쿼리 입력 - 오케스트레이션이 목적 파악(메모리 참고해서) 후 문제 풀기위한 계획을 수립, 필요한 경우 Tool 사용, 마지막으로 LLM 모델이 결과 생성 수 반환
- Model : 생각하고 말하는 두뇌
- Memory : 장기메모리, 단기메모리 왜 나눌까? 무슨 기준으로 나눌까?
- 문맥을 파악하는 것은 단기 메모리, 장기메모리는 과거 학습된 데이터를 가져온다.
5. Agent companion

| (요약) ① 개요
|
- 에이전트 평가 방법 : 에이전트가 어떻게 사고하고 행동했는지 평가
- DevOps : 개발(Development)과 운영(Operations)을 결합한 개념
- MLOps : 머신러닝(ML) 모델의 개발, 배포, 운영을 자동화하고 효율적으로 관리하는 ML 전용 DevOps
-
FMOps : 대규모 사전학습 언어모델(LLM)이나 멀티모달 모델 등 Foundation Model의 전 과정(학습, 미세조정, 배포, 모니터링)을 안정적이고 지속적으로 관리하기 위한 운영 체계)
- 멀티 에이전트 : 여러 개의 AI 에이전트가 서로 다른 역할을 수행하면서 공동 목표를 달성하는 시스템 구조.
- 계층형 : 상위 에이전트가 하위 에이전트를 관리, 감독, 명령–수행 구조
- 다이아몬드형 : 여러가지 에이전트가 병렬로 통합해서..
- 동료간: 에이전트들이 동등한 위치에서 서로 협력하며 문제를 해결,
- 협력형 : 여러 에이전트가 공유 목표를 위해 역할을 분담하고 협력적으로 작동

실습 - n8n 활용
- 로컬기반 설치 사용은 무료
GitHub - n8n-io/n8n: Fair-code workflow automation platform with native AI capabilities. Combine visual building with custom cod
Fair-code workflow automation platform with native AI capabilities. Combine visual building with custom code, self-host or cloud, 400+ integrations. - n8n-io/n8n
github.com
ex) 네이버 블로그 맛집 검색 api 연결 agent

* cmd 에서 n8n 설치 후 로컬 주소 get -> 네이버 개발자 - application - api 정보를 HTTP request에 입력

(참고)

6. Model

'KPMG Future Academy 6기' 카테고리의 다른 글
| (삼정 KPMG future academy 6기 수업) AI agent 2 (1) | 2025.10.21 |
|---|---|
| (삼정 KPMG future academy 6기 이슈) A2A 금융권 대응 전략 (0) | 2025.10.21 |
| (삼정 KPMG future academy 6기 수업) AI agent 관련 미니 과제 (0) | 2025.10.20 |
| (삼정 KPMG future academy 6기 수업) - 17. 멀티모달 (0) | 2025.10.20 |
| (삼정 KPMG future academy 6기 이슈) 커머스 (0) | 2025.10.20 |
