심심풀이/AI 음성2024. 1. 3. 19:25
 

EasyBertVits2를 이용해 애니메이션 캐릭터의 TTS 만들기-학습(3)

이제 마지막으로 학습 데이터를 지정된 위치에 넣어주고 파라미터 값을 적절하게 수정하여 학습 코드를 실행시키면 됩니다. 먼저 EasyBertVits2 폴더에 있는 Download-LearningSample-JVNV.bat을 실행해서 학

joonnotes.tistory.com

이전 포스트처럼 학습 폴더의 구조와 파일을 정리해놓았다면 Learn.bat 파일을 실행해 학습을 시작합니다.

걸리는 시간은 8GB VRAM 기준 평균 1.7 sec/iteration 이 나옵니다. 다만 음성 파일의 길이가 2-4초인 것이 대다수라 일반적으로는 더 느린 속도가 나올 것입니다. 따라서 2000iteration 기준 대략 150분 정도의 시간을 예상하면 될 것 같습니다.

실행화면

일단 학습 데이터는 4분 30초 정도, 4000 iteration으로 학습을 진행해보았습니다. 일반적으로 20분 정도 가량의 학습 데이터가 적정 수준으로 여겨짐을 고려할 때 다소 학습 데이터의 양이 부족하기는 합니다. 그럼에도 학습된 모델의 결과물을 보면 꽤나 괜찮은 퀄리티가 나오는 것을 확인할 수 있습니다.

 

Posted by 돌멩이와 쥐