1. 현재 16개 데이타 셋에 대한 Finetuning 진행중

    1. 파인튜닝 코드를 여러가지 실행해 봤으나 동작하지 않아, lit-gpt 사용중
    2. 프로젝트 하나를 파인튜닝하는데 14시간 이상 수행하여도 끝나지 않아 중간에 멈춘 상태임
    3. 100 step 이후 중간에 떨어진 pth 파일로 test 데이타 하나를 입력해 보았더니 정확한 값이 나오긴 했음
  2. google colab을 통해 finetuning이 가능한지 알아 보기 위해 유튜브를 참고하여 시도

    1. https://www.youtube.com/watch?v=LslC2nKEEGU
    2. 기존의 환경을 모두 리셋하기 위해 ‘런타임’ > ‘런타임 연결 해제 및 삭제’ 실행
    3. 설치 과정에서 보니 아래 모듈이 설치되어 있어야 아래 설치 코드 실행 가능함
      1. !pip install kaleido
      2. !pip install openai
      3. !pip install cohere
    !pip install autotrain-advanced
    !pip install huggingface_hub
    
  3. 아래 코드 실행하였더니 유료 버전의 컴퓨팅 자원을 구매하여야만 가능한 것으로 실행 가능한 것으로 보임

    !autotrain llm --train --project_name 'llama2-openassistant' --model TinyPixel/Llama-2-7B-bf16-sharded --data_path timdettmers/openassistant-guanco --text_column text --use_peft --use_int4 --learning_rate 2e-4 --train_batch_size 2 --num_train_epochs 3 --trainer sft --model_max_length 2048 --block_size 2048 > training.log &

    Traceback (most recent call last): File "/usr/local/bin/autotrain", line 8, in <module> sys.exit(main()) File "/usr/local/lib/python3.10/dist-packages/autotrain/cli/autotrain.py", line 47, in main command = args.func(args) File "/usr/local/lib/python3.10/dist-packages/autotrain/cli/run_llm.py", line 14, in run_llm_command_factory return RunAutoTrainLLMCommand(args) File "/usr/local/lib/python3.10/dist-packages/autotrain/cli/run_llm.py", line 443, in init raise ValueError("No GPU/MPS device found. LLM training requires an accelerator") ValueError: No GPU/MPS device found. LLM training requires an accelerator

  4. colab 우측 상단의 RAM, 디스크 아래 삼각형을 클릭 ‘리소스 보기’를 선택하면 리소스가 없음을 알 수 있고 구매해야 한다는 안내가 나옴

Llama2_finetuning.ipynb