今回はずんだもんなどのキャラクターの声を
音声合成できるソフトVOICEBOXを
Google Colabで使う方法についてです


解説動画はこちら



VOICEVOXとは

VOICEVOXは無料のテキスト読み上げソフトウェアで
ずんだもんなど、複数のキャラクターが存在する
音声合成ソフトです。

音声合成の精度もなかなかなものです。


インストール方法

下記のコマンドを貼り付けて実行です
!curl -sSfL https://raw.githubusercontent.com/VOICEVOX/voicevox_core/8cf307df4412dc0db0b03c6957b83b032770c31a/scripts/downloads/download.sh | bash -s
cd voicevox_core/
!wget https://github.com/VOICEVOX/voicevox_core/releases/download/0.14.1/voicevox_core-0.14.1+cpu-cp38-abi3-linux_x86_64.whl
!pip install voicevox_core-0.14.1+cpu-cp38-abi3-linux_x86_64.whl
!wget https://raw.githubusercontent.com/VOICEVOX/voicevox_core/406f6c41408836840b9a38489d0f670fb960f412/example/python/run.py



音声合成のコマンド

下記のコマンドで音声合成が行えます
主にテキストとスピーカーIDの部分を
変えるだけです。
dirs = './open_jtalk_dic_utf_8-1.11'
out_path = '../out.wav'
text = 'テキスト'
speaker_id = スピーカーID

!python ./run.py --dict-dir $dirs --text $text --out $out_path --speaker-id $speaker_id
out_pathで指定した場所に音声ファイルが出力されます。


スピーカーID

この指定で使えるIDは次のようになっているようです

キャラクター 口調 キャラクターID
四国めたん ノーマル 2
四国めたん あまあま 0
四国めたん ツンツン 6
四国めたん セクシー 4
四国めたん ささやき 36
四国めたん ヒソヒソ 37
ずんだもん ノーマル 3
ずんだもん あまあま 1
ずんだもん ツンツン 7
ずんだもん セクシー 5
ずんだもん ささやき 22
ずんだもん ヒソヒソ 38
春日部つむぎ ノーマル 8
雨晴はう ノーマル 10
波音リツ ノーマル 9
玄野武宏 ノーマル 11
玄野武宏 喜び 39
玄野武宏 ツンギレ 40
玄野武宏 悲しみ 41
白上虎太郎 ふつう 12
白上虎太郎 わーい 32
白上虎太郎 びくびく 33
白上虎太郎 おこ 34
白上虎太郎 びえーん 35
青山龍星 ノーマル 13
冥鳴ひまり ノーマル 14
九州そら ノーマル 16
九州そら あまあま 15
九州そら ツンツン 18
九州そら セクシー 17
九州そら ささやき 19
もち子さん ノーマル 20
剣崎雌雄 ノーマル 21
WhiteCUL ノーマル 23
WhiteCUL たのしい 24
WhiteCUL かなしい 25
WhiteCUL びえーん 26
後鬼 人間ver. 27
後鬼 ぬいぐるみver. 28
No.7 ノーマル 29
No.7 アナウンス 30
No.7 読み聞かせ 31
ちび式じい ノーマル 42
櫻歌ミコ ノーマル 43
櫻歌ミコ 第二形態 44
櫻歌ミコ ロリ 45
小夜/SAYO ノーマル 46
ナースロボ_タイプT ノーマル 47
ナースロボ_タイプT 楽々 48
ナースロボ_タイプT 恐怖 49
ナースロボ_タイプT 内緒話 50

IDを指定してキャラクターを変更できます。


試しにずんだもんで音声合成すると
こんなコードになります。
dirs = './open_jtalk_dic_utf_8-1.11'
out_path = '../out.wav'
text = 'どうも、ずんだもんです。よろしくね'
speaker_id = 1

!python ./run.py --dict-dir $dirs --text $text --out $out_path --speaker-id $speaker_id
from IPython.display import Audio
Audio('../out.wav', autoplay=True)

出来上がった音声は
動画の方で確認してみて下さいね

VOICEBOX自体は
UI付きのソフトウェアで提供されていますが
大量のテキストを自動で音声化させたりしたい場合は
プログラムを使ってやるのが楽ですねー

そういう用途に使いたい方は
是非参考にしてみて下さい。

それでは。