이전 포스트처럼 학습 폴더의 구조와 파일을 정리해놓았다면 Learn.bat 파일을 실행해 학습을 시작합니다.
걸리는 시간은 8GB VRAM 기준 평균 1.7 sec/iteration 이 나옵니다. 다만 음성 파일의 길이가 2-4초인 것이 대다수라 일반적으로는 더 느린 속도가 나올 것입니다. 따라서 2000iteration 기준 대략 150분 정도의 시간을 예상하면 될 것 같습니다.
일단 학습 데이터는 4분 30초 정도, 4000 iteration으로 학습을 진행해보았습니다. 일반적으로 20분 정도 가량의 학습 데이터가 적정 수준으로 여겨짐을 고려할 때 다소 학습 데이터의 양이 부족하기는 합니다. 그럼에도 학습된 모델의 결과물을 보면 꽤나 괜찮은 퀄리티가 나오는 것을 확인할 수 있습니다.
'심심풀이 > AI 음성' 카테고리의 다른 글
토오사카 린 TTS(EasyBertVits2) 학습 샘플 (0) | 2024.01.04 |
---|---|
EasyBertVits2를 이용해 애니메이션 캐릭터의 TTS 만들기-학습 세팅 (0) | 2024.01.03 |
EasyBertVits2를 이용해 애니메이션 캐릭터의 TTS 만들기-데이터 준비하기(2) (0) | 2024.01.03 |
EasyBertVits2를 이용해 애니메이션 캐릭터의 TTS 만들기-데이터 준비하기(1) (0) | 2024.01.03 |
EasyBertVits2를 이용해 애니메이션 캐릭터의 TTS 만들기-설치 (2) | 2024.01.03 |