LAB 소개
저희 TTS LAB은 사용자와 AI 간의 자연스러운 음성 대화를 실현하기 위해, 최신 기술인 디퓨전 모델을 기반으로 한 음성 생성(TTS) 기술을 중점적으로 연구 개발합니다.
핵심 연구 내용
- 디퓨전 기반 TTS 모델: 기존 모델을 뛰어넘어, 사람처럼 감정이 풍부하고 생동감 넘치는 목소리를 빠르고 안정적으로 생성하는 디퓨전 기반 음성 합성 기술을 연구합니다.
- 구어체 LLM: 음성 대화에 특화된 대규모 언어 모델(LLM)을 개발하여, 딱딱한 문어체가 아닌 자연스러운 구어체 답변을 생성합니다.
- 실시간 상호작용: 사용자의 말에 즉각적으로 반응하고, 대화 중 끼어들어도 자연스럽게 대처할 수 있는 실시간 음성 통신 및 처리 기술을 구현합니다.
LAB 계획
<aside>
💡
매주 수요일 10:00~ 12:00 온라인
- 30분: Small Talk 및 AI 소식 공유
- 70분: 연구 및 구현 내용 공유
- 20분: 다음주 할일 정하기 및 역할 분담
</aside>
LAB 목표
TTS 최신 연구 논문 스터디
- 특정 키워드에 대한 리서치를 매주 한명씩 돌아가면서 발표 (발표 주제는 모임 마지막에 결정)
- 연구 및 구현 내용은 짧게라도 모든 구성원이 간단히 소개
- 매주 AI 소식 공유는 모든 구성원이 한개 이상
📢 LAB 주차별 활동
LAB 발표 자료실
Untitled
LAB 자료실
LAB 연구원
LAB 활동 (클릭)
공유 자료
논문 자료
GPU 서버 지원 안내
연구원 분들의 개인 공간
김영인
유건령
변용훈
최미영
김소정
김수용
LAB 연구원 소개
Untitled