본문 바로가기

렝체인7

5-1(챗봇이란?, 임베딩) 챗봇 만들기 LLM 기반 챗봇들은 고객 서비스와 같은 대화영 작업에서는 유창하나. 세계 지식이 부족하기 때문에 주제별 질문에는 잘 답변을 못한다. 이를 극복하기 위해 RAG를 통해 어떻게 해결할 수 있는지 탐구해 본다.핵심은 문서를 벡터 임베딩으로 말뭉치(corpus)를 인코딩해 신속한 의미 검색을 가능하게 하고, 검색 결과를 챗봇의 프롬프트에 통합하는 것이다.주요 주제(Topic)챗봇이란 무엇인가?검색과 벡터의 이해LangChain에서의 로딩 및 검색챗봇 구현응답 중재1. 챗봇이란 무엇인가?챗봇이란, 텍스트 또는 음성을 통한 대화 상호 작용 시뮬레이션 AI 프로그램이다. GPT-3와 같은 LLM 출현은 ChatGPT(2022)와 같은 더 인간적인 챗봇 시스템을 가능하게 하였으나, 그 능력은 여전히 상당히 제한적이다.. 2024. 5. 2.
4-3-1(툴을 사용한 질문 응답) Langchain 비서 구축 3. 툴을 사용한 질문 응답1. 툴을 사용한 정보 검색Langchain에서는 다양한 도구를 사용할 수 있다. 아래 코드는 LangChain 라이브러리를 이용하여 특정 질문에 대한 답변을 생성하는데 이 과정에서 Duck Duck go 검색, Arxiv, Wikipedia을 활용하는 예제이다.%%time# from langchain.agents import AgentExecutor, AgentType, initialize_agent, load_toolsfrom langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler#위에서 선언하였음.# from langchain.llms import GPT4All# model = "E:\\GPT4.. 2024. 4. 23.
4-2-3(정보요약, 맵 리듀스 파이프라인) Langchain 비서 구축 2. 정보 요약 빠르게 변화하는 요즘 환경에서는 지속적으로 증가하는 정보 양에 대응하는 것이 어렵다. 특히 컴퓨터 과학 및 AI 분야는 더욱 그렇다. 수 많은 논문을 읽고 이해하는 것에 시간이 너무 많이 소요된다. 이 때 자동화가 중요한 역할을 한다. LLM은 강력한 언어 이해 능력을 통해 텍스트를 간추리는 데 뛰어나다. LangChain을 사용해 요약 기술을 더욱 정교한 수준으로 탐색해 보자. 4. 맵 리듀스 파이프라인 Langchain은 맵 리듀스 접근방식을 지원한다. 긴 문서를 요약하기 위해 먼저 문서를 LLM의 토큰 컨텍스트 길이에 적합한 작은 부분(청크 chunk)으로 나눈 다음, 맵 리듀스 체인이 이러한 청크를 독립적으로 요약한 후 재결합할 수 있다. 이렇게 하면 어떤 길이로도 요약을 확장할 .. 2024. 4. 22.
4-2-2(정보요약, 프롬프트 템플릿, 밀도체인) Langchain 비서 구축 2. 정보 요약 빠르게 변화하는 요즘 환경에서는 지속적으로 증가하는 정보 양에 대응하는 것이 어렵다. 특히 컴퓨터 과학 및 AI 분야는 더욱 그렇다. 수 많은 논문을 읽고 이해하는 것에 시간이 너무 많이 소요된다. 이 때 자동화가 중요한 역할을 한다. LLM은 강력한 언어 이해 능력을 통해 텍스트를 간추리는 데 뛰어나다. LangChain을 사용해 요약 기술을 더욱 정교한 수준으로 탐색해 보자. 2. 프롬프트 템플릿 동적 입력에 대해 프롬프트 템플릿은 미리 정의된 프롬프트에 텍스트를 삽입할 수 있게 하여 변수 길이 제한과 모듈식 프롬프트 디자인을 허용한다. 이를 LangChain 표현 언어 LCEL(LangChain Expression Language)에서 구현할 수 있다. from langchain.l.. 2024. 4. 22.