[25년 독후감 11] LangChain부터 RAG까지, 실무형 AI 에이전트 개발의 모든 것

2025. 5. 15. 13:21지식 도구/독서

반응형

이지스퍼블리싱 서평단으로 선정되어 도서를 지원받아 솔직하게 쓴 글입니다. 

📖 책 정보

  • 책 제목: Do it! LLM을 활용한 AI 에이전트 개발 입문
  • 저자: 이성용
  • 출판 연도: 25.05.09
  • 장르: 컴퓨터/IT


❓ 책을 고른 이유 (물음표)

  • 이 책을 읽게 된 계기, 책을 선택하게 된 이유 (트렌드, 개인 필요, 호기심 등), 책을 읽고 난 뒤 기대효과 등

요즘 ChatGPT를 비롯한 생성형 AI 기술이 빠르게 확산되면서, 자연스럽게 나도 LLM(Large Language Model)에 대한 관심이 높아졌다. 특히 나는 외국인 노동자를 위한 법률 챗봇, 주식 분석 봇, 면담 기록 자동화 등 실제로 서비스를 구현하려는 목표가 있기 때문에 단순한 개념보다 "어떻게 실습하고 실제로 만들 수 있느냐"가 더 중요했다.
《Do it! LLM을 활용한 AI 에이전트 개발 입문》은 단순한 GPT API 사용법을 넘어 LangChain, LangGraph, RAG까지 다루며 직접 챗봇과 멀티에이전트를 개발해볼 수 있는 실전 중심의 책이다.
또한 내가 관심 있는 ‘논문 요약 AI’, ‘회의록 정리’, ‘미국 주식 분석’, ‘YouTube 요약’, ‘로컬 RAG 시스템 구축’ 등 실생활에 바로 적용 가능한 예제가 많아, 단순히 흥미를 넘어서 내 프로젝트에 큰 도움이 될 것 같다는 확신이 들었다.
이 책을 통해 단순히 GPT를 사용하는 수준을 넘어서, 실무에 쓸 수 있는 "AI 에이전트를 직접 설계하고 완성하는 개발자"로 한 단계 도약하길 기대한다.


📚 독서 과정

  • 읽은 기간: 25.05.08 ~ 25.05.17
  • 인상 깊었던 구절: (노란 색연필로 표시한 부분)

책 사진


✍️ 책의 내용과 특장점

내용 중 일부 인상깊은 실습들

간단히 다루고 따로 자세히 블로그 포스팅을 할 예정입니다.

실습 1. 논문 요약 챗봇 만들기

  • PDF를 업로드하고 → 텍스트로 변환하고 → GPT로 요약
  • 활용 예시: 논문, 리서치 정리 전 요약 참고용으로 완전 유용
  • 사진 일부 첨부

 
PDF 파일을 업로드한 뒤, 해당 파일을 파이썬 코드로 텍스트로 변환하고, 그 텍스트를 GPT API에 전달해 요약을 받는 챗봇을 만들어봤다.
OpenAI API와 Python의 PDF 처리 라이브러리를 함께 사용해서 단순 문서 요약이 아닌, 연구 논문처럼 구조가 명확한 문서의 핵심을 뽑아내는 흐름을 구성해봤다.
기존에 GPT를 웹에서만 써봤다면, 이 실습은 텍스트 전처리 + 요약 프롬프트 구성 + 응답 파싱까지 처음부터 구현하는 느낌이었다.
특히 PDF를 불러올 때는 PyMuPDF나 pdfminer.six 같은 라이브러리를 통해 텍스트를 페이지 단위로 추출하고, 텍스트가 너무 길면 청크로 나눠야 한다는 점도 처음 알게 됐다.
나중에 논문을 읽는 시간이 늘어나면, 이 요약 챗봇을 통해 사전 판단(읽을지 말지 결정)을 빠르게 내릴 수 있을 것 같다.

실습 2. 회의록 정리 AI 서기

  • 음성 파일을 Whisper로 텍스트 변환 → 문장 분석 → GPT로 요약 및 교정
  • 활용 예시: 인터뷰나 회의 내용을 자동 정리해 블로그 초안 작성에 활용
  • 사진 일부 첨부

음성파일 요약

음성 파일을 Whisper API를 활용해 텍스트로 변환한 뒤, 각 문장을 분석하고 화자를 구분해 GPT를 통해 자연스럽게 정리된 회의록 형태로 요약해보았다.
실제로 인터뷰나 회의처럼 사람이 이야기하는 대화를 텍스트로 옮기는 과정에서, 단순히 녹취만 하는 것이 아니라 화자별로 정리하고 중요한 내용을 구조화하는 흐름을 경험할 수 있었다.
Whisper는 오픈AI에서 제공하는 음성 인식 모델로, 한국어를 포함한 다양한 언어를 꽤 정확하게 텍스트로 변환해준다.
특히 음성 파일을 로컬에서 처리하는 방법도 배워봤는데, huggingface에서 제공하는 whisper-large 모델을 다운로드해 CPU에서도 텍스트로 변환할 수 있어 확장성 면에서 흥미로웠다.
텍스트 변환 후에는 문장을 시간 순서대로 정리하고, 화자를 구분해 대화 흐름을 더 자연스럽게 만들었다. 마지막으로 GPT를 활용해 전체 회의 내용을 요약하거나, 어투를 맞춰주는 교정도 가능했다.
이 실습은 단순 회의록 기록을 넘어, 내가 블로그나 뉴스레터에 인터뷰 내용을 정리할 때 초안 자동화 도구로 활용할 수 있다는 점에서 실용성이 높았다.

실습 3. GPT와 미국 주식 이야기하기

  • yfinance API 연동 → 주가 정보 불러오기 → GPT로 요약 및 대화
  • 활용 예시: ETF나 종목 투자 정보를 정리하고 주식 콘텐츠에 활용
  • 사진 일부 첨부

테슬라 최근 주가

 
yfinance API를 파이썬 코드에 연동해 미국 주식 데이터를 불러오고, 그 데이터를 GPT에게 전달해 종목에 대한 요약과 투자 관련 대화를 진행해보았다.
단순히 가격 정보를 불러오는 수준을 넘어, 종목의 최근 변동 폭, 시가총액, PER 같은 재무 지표까지 자동으로 정리하고 이를 GPT가 자연어로 설명해주는 구성을 만들어봤다.
이번 실습에서는 함수 콜링(Function Calling) 기능도 함께 활용했는데, GPT에게 "테슬라 요즘 어때?"라고 묻는 식의 명령을 내리면, 내부적으로 정의한 파이썬 함수가 실행되고 그 결과를 GPT가 문장으로 정리해주는 방식이다.
이 과정에서 사용자가 어떤 질문을 하든 자연스럽게 실시간 데이터를 기반으로 응답이 생성되는 인터랙티브한 챗봇 구조를 구현할 수 있었다.
스트림릿(Streamlit) UI까지 적용해 버튼 클릭만으로 주가 정보를 확인하고, GPT와 대화까지 이어지는 형태로 만들 수 있어 사용성과 시각적 완성도도 만족스러웠다.
주식 블로그나 뉴스레터 콘텐츠를 자동화하고 싶은 사람에게 특히 유용한 실습이라고 느꼈다.

실습 4. RAG 기반 챗봇 구현

  • PDF 텍스트 → 임베딩 → 벡터DB → 리트리버 → GPT 응답 생성
  • 활용 예시: 법률 문서나 가이드라인 기반 질의응답 시스템 구현
  • 사진 첨부 

서울시 다양한 정책

PDF 문서를 먼저 텍스트로 변환한 후, 해당 텍스트를 청크 단위로 잘게 나누고, 각 청크를 임베딩 벡터로 바꿔 벡터 DB에 저장했다.
그 뒤 사용자의 질문이 들어오면 질문도 동일한 방식으로 임베딩하고, 벡터 간 유사도를 기준으로 가장 관련 있는 청크를 검색해 GPT에게 전달하는 구조로 챗봇을 구성했다.
이러한 흐름이 바로 RAG(Retrieval-Augmented Generation)이며, LLM의 맥락 부족을 보완하기 위한 매우 강력한 접근 방식이라는 걸 이번 실습을 통해 체감할 수 있었다.
이전에 내가 참여했던 공모전에서는 법률 관련 질의응답 챗봇을 만들었었는데, 그때는 파인튜닝과 프롬프트 엔지니어링만을 활용해 겨우 챗봇을 구성했었다.
심사위원들께서 “RAG는 적용해봤냐”고 물었을 때, 당시에는 그게 뭔지조차 몰랐던 게 아쉬움으로 남아 있었다.
이번 실습을 통해 "아, 이게 그 RAG구나" 하고 감이 잡혔고, 지금 돌아간다면 정확도와 응답 신뢰도를 훨씬 높인 챗봇을 구현할 수 있을 것 같다는 확신이 들었다.
또한 이 구조는 단순 문서 응답뿐 아니라, 자주 바뀌는 가이드라인, 정책 문서, 법률 텍스트 등 신뢰성이 필요한 자료 기반 질의응답 시스템에 특히 적합하다는 점에서 매우 실용적이었다.

실습 5. 유튜브 영상 요약하기

  • 유튜브 자막 불러오기 → 텍스트 정제 → GPT로 요약
  • 활용 예시: 유튜브 영상 정보 정리 및 콘텐츠 기록 자동화
  • 사진 일부 첨부

대선 유튜브 요약

유튜브 영상에서 자막 데이터를 불러와 텍스트로 정제하고, 이를 GPT로 전달해 요약하는 챗봇을 직접 구현해보았다.
실습에서는 YoutubeSearch와 YoutubeLoader 패키지를 활용해 영상 검색 → 자막 추출까지 자동화했고, 추출된 자막은 일정 길이로 나눈 뒤 GPT에게 요약을 요청하는 방식으로 구성했다.
평소에도 릴리스AI 같은 유튜브 요약 서비스를 자주 이용해왔는데, 이번 실습처럼 직접 코드로 구성해보니 단순히 “요약을 받아본다”는 느낌이 아니라, 내가 요약 구조와 흐름을 제어한다는 점에서 훨씬 새로웠다.
특히 어떤 영상을 요약할지, 자막이 없을 경우의 예외 처리, 요약 깊이 조절 등도 내 입맛에 맞게 조정할 수 있었다.
실습에서는 최근 대선 관련 유튜브 영상을 활용해 자막 요약을 진행해봤고, 영상 속 핵심 메시지와 논리 흐름을 빠르게 파악할 수 있었다.
뉴스/정치/기술 콘텐츠처럼 정보 밀도가 높은 영상들을 요약해서 기록하거나, 블로그 콘텐츠로 재가공하는 데 매우 유용한 방식이라는 생각이 들었다.

실습 6. LangGraph 기반 RAG 에이전트 만들기

  • 멀티에이전트 흐름 설계 → 문서 수집 → 관련 내용 필터링 → GPT 응답
  • 활용 예시: 복잡한 문서 기반 질의 시스템 구축, 개인 비서 자동화
  • 사진 첨부

LangGraph를 활용해 멀티에이전트 기반의 RAG 시스템을 직접 설계해보았다.
하나의 에이전트가 전체를 처리하는 것이 아니라, 각 역할을 가진 여러 에이전트들이 문서를 수집하고, 관련 내용을 필터링하고, 최종적으로 응답을 생성하는 협업형 구조를 구현하는 방식이다.
LangGraph는 말 그대로 '그래프 형태'로 상태(State)를 정의하고, 각 노드에 역할 기반 기능을 부여해 에이전트 간의 흐름을 시각적으로 제어할 수 있다는 점이 매우 인상 깊었다.
이번 실습에서는 문서를 임베딩한 후 벡터 DB에 저장하고, 사용자의 질문이 들어오면 해당 질문과 가장 관련 있는 청크(문서 단위)를 필터링한 뒤, 그것을 바탕으로 GPT가 답변을 생성하는 구조를 구축했다.
중간에 라우터(Router)를 통해 역할을 분기하고, 필요에 따라 벡터 검색 에이전트나 웹 검색 에이전트를 불러오는 부분도 실제 서비스 설계처럼 느껴져서 굉장히 흥미로웠다.
이전 실습들과 달리 이 과정은 하나의 질문에 대해 ‘적절한 경로를 따라 협업하는 AI 구조’를 어떻게 설계하느냐가 핵심이라서, 단순 GPT 활용을 넘어선 확장성을 체감할 수 있었다.
앞으로 이런 구조는 개인 비서, 지식관리 시스템, 고객 상담 챗봇 등 복잡한 정보를 다뤄야 하는 곳에서 유용하게 쓰일 수 있을 것 같다.

특장점

1) 구성과 흐름이 체계적이다
이 책은 단순히 LLM을 활용하는 법만 알려주는 입문서가 아니다.
총 4개의 마당(Part)으로 구성되어 있으며, 기초 개념 → 실습 적용 → 응용 확장으로 이어지는 자연스러운 흐름을 갖춘다.

  • 1마당에서는 LLM이 무엇인지, 왜 중요한지, GPT API는 어떻게 시작하는지를 설명하며 독자의 기본기를 다진다.
  • 2마당부터는 논문 요약, 회의록 정리, 이미지 분석, 주식 분석 등 실제 사용할 수 있는 업무 자동화 프로젝트를 하나씩 만들어가며 활용도를 높인다.
  • 3~4마당에서는 LangChain, LangGraph, RAG 등 생성형 AI의 핵심 기술을 다루며 실무형 멀티에이전트 시스템을 구현할 수 있도록 확장해준다.

단계별 구성이 논리적으로 잘 짜여 있어, 처음부터 끝까지 순서대로 따라가면 자연스럽게 AI 에이전트 개발자 마인드셋과 스킬이 체득되는 방식이다.

2) 초보자도 막힘 없이 따라갈 수 있다
이 책은 GPT API나 LangChain에 처음 도전하는 사람도 막히지 않고 실습을 완주할 수 있도록 세심하게 설계되었다.

  • 15일 코스, 30일 코스의 학습 계획표가 제공되어 목표를 세워 공부할 수 있다.
  • 실습 예제 코드가 각 장에 구체적으로 제공되며, 완성된 결과 코드와 비교 파일도 함께 제공되어 자신이 구현한 코드와 차이점을 비교하며 성장할 수 있다.
  • 실습 중 막히기 쉬운 포인트에는 ‘한 걸음 더!’라는 코너가 있어 문제 해결과 보완 학습까지 유도해준다.

혼자서도 차근차근 배우고 싶은 개발 입문자, 학생, 현업 기획자 모두에게 부담 없이 권할 수 있는 구성이다.

3) 다양한 실습 예제와 실전 적용성
이 책은 단순한 챗봇 만들기에 그치지 않고, 다양한 LLM 활용 시나리오를 실습 프로젝트로 직접 구현해보게 한다.

  • PDF를 분석하고 요약해주는 AI 연구원, 회의록을 정리해주는 AI 서기, 주가 데이터를 분석해 대화해주는 AI 투자자,
  • 유튜브 자막을 읽고 정리하는 AI 영상 요약가, LangGraph를 활용한 멀티에이전트 RAG 시스템 등 여러 실무형 AI 에이전트를 만들어볼 수 있다.

이 중 하나만 제대로 구현해도 블로그 콘텐츠, 개인 프로젝트, 팀 협업 툴로 바로 써먹을 수 있을 정도로 활용도가 높다.
단순한 따라하기 책이 아니라, “내 상황에 맞는 AI 에이전트를 만들 수 있는 기술력”을 길러주는 실전형 교재다.


❗ 책을 덮으며 느낀 변화 (느낌표)

  • 이 책을 통해 배운 점
  • 나의 관점, 생각, 삶의 변화
  • 앞으로의 적용 방안

처음 이 책을 펼쳤을 때만 해도 LangChain, RAG 같은 개념들이 막연하게 느껴졌었다. 하지만 각 마당마다 제공되는 실습을 따라가다 보니 어느새 GPT를 활용해 나만의 에이전트를 만들고, 멀티에이전트 시스템까지 구현해보는 경험을 하게 되었다.
책 전체가 윈도우 기준으로 설명되어 있어서 맥북 사용자 입장에서 가끔 헤매는 순간도 있었지만, 오히려 그 과정에서 환경설정이나 패키지 설치의 원리를 더 깊이 이해하게 되는 계기가 되었다. 단순히 코드를 따라 치는 게 아니라, 환경을 설정하고 문제를 해결하는 개발자의 태도까지 함께 배운 느낌이었다.
또한 각 실습이 단순한 기능 구현을 넘어, 실제 나의 삶이나 프로젝트에 바로 연결할 수 있는 주제들이라는 점에서 더 몰입해서 해볼 수 있었다. 특히 예전 공모전 때 막연하게만 들었던 ‘RAG’라는 기술을 이번에 직접 구현해보고 나니, 과거의 아쉬움이 ‘성장’으로 전환된 느낌이었다. 이 책을 통해 단순히 "GPT를 써볼 수 있다" 수준에서 멈추지 않고, GPT를 포함한 LLM 기술을 직접 연결하고 응용해서 ‘쓸 수 있는 도구’로 만드는 힘을 얻게 되었다. 앞으로도 내 개인 서비스, 블로그, 프로젝트에 이 흐름들을 실전으로 가져갈 수 있을 것 같다.


🌟 총평 및 추천 여부

  • 별점: ★★★★☆ (5점 만점 중 4.5점)
    (실습 중심 구성, 다양한 예제, 실전 응용성 모두 훌륭했지만 맥북 사용자에겐 약간의 장벽이 있음)
  • 이 책을 추천하는 대상:
    • LLM, GPT API, LangChain, RAG, 멀티에이전트 시스템 등
      생성형 AI 기술을 실습으로 체득하고 싶은 개발자 및 기획자
    • 블로그/유튜브/콘텐츠 자동화에 관심 있는 사람
    • 실무형 AI 서비스를 직접 구현해보고 싶은 컴퓨터공학/소프트웨어 전공자
  • 한줄평: GPT를 쓰는 수준에서 벗어나, 'AI 시스템을 설계하는 사람'으로 성장하고 싶다면 이 책으로 시작하자! 

서점 링크

예스24: https://vo.la/ydENjYv

교보문고: https://vo.la/RwUfBv

알라딘: https://vo.la/PuacXz

 

반응형