Beatrice Q&A
最終更新 2024年8月8日

追記
私のガイドよりも↓の記事を優先してご覧ください。
この記事の案内に従うだけで簡単にBeatriceを導入できます。

「Beatrice」モデル学習用ツールキット ワンクリック導入法(※非公式)
https://note.com/uunin/n/nb9e04ba201d5

質問1
Beatriceとは何ですか?

答え1
公式サイトの説明を引用します。
https://prj-beatrice.com/

Beatrice は、
・軽量 (CPU シングルスレッドで動作)
・低容量 (約 35 MB)
・低遅延 (約 0.05 秒、外部の録音機器による実測値)
を特徴とする AI ボイスチェンジャー VST® です。
誰でも無料で使うことができます。

質問2
RVCみたいに任意の声を学習させることは出来ますか?

答え2
可能です。
学習方法は自分のPCで学習する方法と、Google Colabで学習する方法の二種類あります。

自分のPCで学習する場合はこちらをご覧ください。
ただし、ある程度の知識が必要な上に高性能なGPUが必要となるので注意して下さい。
https://huggingface.co/fierce-cats/beatrice-trainer

pyproject.tomlのtorchとtorchaudioをGPU版に変更する方法はこちらをご覧ください。
https://zenn.dev/zerebom/articles/b338784c8ac76a

AttributeError: Can't get attribute 'WavDataset' on <module 'main' (built-in)>
学習開始時に発生する上記のエラーは下記の学習コマンドに変更する事で解決できます。
python beatrice_trainer/main.py -d data -o output
このコマンドの場合、dataフォルダの中に話者名のフォルダを作成しその中に音声ファイルを入れます。
学習結果はoutputフォルダに出力されます。

NameError: name 'data_iter' is not defined
上記のエラーは学習用の音声をモノラルにする事で発生しなくなります。

Training finished.が何度も出現し学習が遅くなる問題は
beatrice_trainer/main.pyの
training_loader = torch.utils.data.DataLoader(より下の部分に
persistent_workers=Trueを追加する事で解決できます。

初心者の方はGoogle Colabで学習する方法をおすすめします。
案内に従って進めていくだけで学習が可能で、自分のPCの性能に関係なく学習できます。
https://github.com/w-okada/beatrice-trainer-colab

質問3
ダウンロードするにはどうすればいいですか?

答え3
二つのバージョンがあり、それぞれダウンロードする方法が違います。

まずVST版をダウンロードする方法です。
https://prj-beatrice.com/
公式サイトにアクセスし、新バージョン情報という所のVer. 2.0.0-beta.0にアクセスするとダウンロードが始まります。

次にVC Client版をダウンロードする方法です。
VST版の使い方が分からない方は、こちらを使用する事をお勧めします。
https://huggingface.co/wok000/vcclient000/tree/main
こちらからダウンロードできます。
WIndowsをお使いの方はvcclient_win_stdという名前から始まるVC Clientをダウンロードして下さい。
Macをお使いの方はvcclient_macという名前から始まるVC Clientをダウンロードして下さい。

質問4
使い方を教えてください。

答え4
https://prj-beatrice.com/
VST版については、公式サイトにアクセスし、つかいかたという所のREADME.pdfにアクセスすると使い方を読むことが出来ます。
ただし、現在使い方が最新バージョンに対応していないので注意して下さい。
しかしそれでも、根本的な使い方は同じなので役に立つと思います。
モデルの読み込み方についてはこちらの使い方に書かれていないので説明します。
起動した後Modelという項目がunloadedとなっているのでそこをクリックし、先ほどダウンロードしたbeatriceのフォルダの中にあるbeatrice_paraphernalia_jvsの更に中にある、beatrice_paraphernalia_jvs.tomlを選択します。
そうするとモデルがロードされます。
他のモデルをロードしたい時も同じようにモデルのフォルダの中にあるtomlファイルを選択します。

https://github.com/w-okada/voice-changer/blob/v.2/docs/01_basic_v2.0.z.md
VC Client版の使い方は、こちらをご覧ください。
起動した後、複数のキャラクターのアイコンが表示されますが、その中でJVSというアイコンを選択するとBeatriceを使用するモードに入ります。
低遅延にするためには、Audioの項目でクライアントではなくサーバーを選択し、入力・出力をWASAPIに設定する必要があります。
デフォルトでモデルがロードされていますが、他のモデルをロードするには、画面の編集からアップロードを選択し、Voice Changer TypeをBeatrice v2にします。
その後ZIPファイルに圧縮された状態のモデルファイルを選択します。
そうするとモデルがロードされます。

Edit

Pub: 21 Jul 2024 04:10 UTC

Edit: 07 Aug 2024 21:24 UTC

Views: 1628