• Diffusion

    • 볼거
      • 블로그
        • https://yang-song.net/blog/2021/score/
      • 모두팝 4강 전체
      • pr-400
        • https://youtu.be/uG2ceFnUeQU?si=iK1lOYWEgUpA6BnS
      • dmqa seminar
        • https://youtu.be/d_x92vpIWFM?si=THBORzgLY3MaUzNl
    • 요약
      • 영인

        Summary of Generative Modeling by Estimating Gradients of the Data Distribution (Yang Song)

        • Simple outline
          • DPMs (Diffusion Probabilistic models) → DDPM (J. Ho et al. 2021) → DDIM → LDM → other controllable diffusions …

          • SBMs (Score-based models) → SDE (Y. Song et al. 2022) + PF-ODE → Consistnecy model → …

            Summary of Generative Modeling by Estimating Gradients of the Data Distribution (Yang Song)

          • Flow-based models (Normalizing Flow) → Continuous normalizing flow → Conditional Flow matching (CFM) → …

      • 미영

        5주차과제1 (1)

        5주차과제2 (1)

        5주차과제3 (1)

  • TTS

    • GRAD-TTS 수용님 세미나 → 다다음주로 변경
    • 수용님 Diffusion으로 하신 프로젝트 설명
      1. ControlNet을 이용해서 Quality Diversity Human Feedback 을 향상시킬 수 있는 방법
      2. SD + RoLA finetuning을 이용해서 옷 디자인 생성하는 모델
      3. Inpainting 해커톤
  • 다음주 할 일

    • Grad-TTS 논문 보고 코드 구현
    • 수용님 다다음주에 ControlNet 세미나
    • 최신 논문 research (각자 1편)
      • 23년 이후 논문 기준. 디퓨전 기반에 controllability 관련 논문 위주.
      • 이 페이지 뭐 할지 남기기 (First Come First Serve)
      • 영인: CoMoSpeech (https://arxiv.org/pdf/2305.06908.pdf)
      • 건령: pflow (https://openreview.net/pdf?id=zNA7u7wtIN)
      • 용훈: NatrualSpeech 3 (https://arxiv.org/abs/2304.09116)
      • 미영: YourTTS (https://arxiv.org/pdf/2112.02418.pdf)
      • 수용:
      • 소정:
    • https://github.com/TouchSky-Lab/Awesome-Text-to-Speech-TTS