프로젝트 목표

문제의 발견

주요 마일스톤

image.png

  1. 기존 service/ dataset/ DB 조사
  2. Testcases (사용자 query) 수집
    1. 연령/복지분야/지역 등등의 소비자 scope 확정
      1. MVP implementation may be more accessible to IT-friendly 젊은세대 (부양청년/ 성학대 여성 등)
    2. 실제 혹은 생성 케이스
  3. 복지전문가를 통한 정답 수집
    1. 전문가가 정답을 생성하는 과정을 이해하고 사용되는 resource (DB등) 파악
  4. 수집된 정답 : (사용자 Query, 전문가 정답)을 Ground-truth로써 chatbot output을 평가하는데 활용
  5. Chatbot : 다양한 구조의 RAG system을 테스트* (아래 참조)
  6. Evaluation : 정답과 Chatbot 응답의 유사도를 간단하게 비교
    1. 눈으로
    2. ROUGE : literal overlap
    3. Embedding score : semantic similarity
    4. RAGAS score: recall/precision of sentences using LLM