<RAG 시스템 구축을 위한 랭체인 실전 가이드> 윤성재, 루비페이퍼

와~ 진짜가 나타났다~!!!

이런 느낌의 책을 만났다.

프라이빗 LLM 환경을 위한 노력이 늘어나고 RAG로 할루시네이션이 어느 정도 극복되었다고 알려지면서 많은 분야에서 LLM을 활용하려는 시도가 있어왔고 나에게도 많은 도전과제들이 제시되고 있는 상황에서 만난 이 책은 개발자입장에서 RAG방식으로 LLM을 활용하고자 할 때 꼭 읽어봐야하는 입문서가 될 것이라고 확신한다.

유사한 책들이 쏟아지고 있어 여려 책을 접해봤지만 이 책처럼 실무를 통해 자신이 겪은 경험을 오롯이 녹아낸 책을 본적이 없다.

LLM 기술 자체에 대해 좀더 이론적으로 설명하거나 아니면 원리에 대해서는 간략히 설명한 후 실행코드만 나열하는 경우가 대부분이었던 와중에 이 책은 이론과 실무의 경계를 적절하게 배합해 논 책이었다.

책은 크게 LLM이란 무엇이고 어떤 생태계로 구성되어 어떻게 활용되고 있는 지 먼저 설명한 후에 langchain으로 LLM을 다루는 기술에 대해 자세하게 설명한다.

특히 RAG를 구성하기 위해 필요한 텍스트 임베딩에 대해 PDF, word, ppt, csv등 다양한 포맷의 문서들 뿐아니라 가장 많이 사용하는 PDF 로더 들의 특장점들도 비교해 두고 있으며 텍스트 임베딩 과정이 왜 어렵고 복잡한지에 대해서도 실제 예제를 통해 잘 설명해 주고 있다.

프롬프트에 대해서도 단순히 프롬프트를 생성하는 것이 아니라 실제 정확한 결과를 얻기 위해 필요한 기술들을 이론과 더불어 코드레벨에서 자세하게 설명하고 있다.

RAG 기술을 위해 많이 사용되고 있는 Vector DB도 각각의 데이터베이스 마다 가지는 특징이 무엇이고 어떤 면에서 솔루션을 선택해야 할 지에 대해서 구체적으로 언급하고 있어 실무적으로 도움이 되었고 이 책을 통해 현재 진행하는 프로젝트에서 가지고 있는 의문점들에 대해 좀더 깊이 있게 이해할 수 있었다.

책의 마지막에 Streamlit을 이용해 실제 RAG 기술을 적용한 쳇봇도 만들어 볼 수 있도록 예시를 꾸며놓았고 모든 소스는 저자의 깃허브를 통해 직접 받아서 실행해볼 수 있다는 점도 마음에 들었다.

당장 실무에서 RAG 기술을 적용한 LLM 시스템을 구축하려고 한다면 이 책은 필독 도서가 되야 할 것 같다.

앞서 여러 사람들과 함께했던 LLM관련 스터디에서도 이론적으로 다가가다보니 이해가 어렵거나 실무적으로 이해하고 싶었던 내용이 이 책에서 구체적으로 잘 표현되어있어 너무도 반가웠다.

저자의 능력도 뛰어났지만 이런 책을 기획하고 작업한 출판사의 선택도 쉽지 않았을 것이라고 생각한다.

아무래도 범용적인 환경을 가정하고 만들어진 예제들이라 라마와 같은 sLLM 모델들에 대한 언급이나 예시가 없는 점은 좀 아쉬웠지만 관련 내용이 후속작으로 나올 것이라는 기대를 가져본다.

 

 

 

Posted by 휘프노스
,