今回はずんだもんなどのキャラクターの声を
音声合成できるソフトVOICEBOXを
Google Colabで使う方法についてです
解説動画はこちら
VOICEVOXとは
VOICEVOXは無料のテキスト読み上げソフトウェアで
ずんだもんなど、複数のキャラクターが存在する
音声合成ソフトです。
音声合成の精度もなかなかなものです。
インストール方法
下記のコマンドを貼り付けて実行です
音声合成のコマンド
下記のコマンドで音声合成が行えます
主にテキストとスピーカーIDの部分を
変えるだけです。
スピーカーID
この指定で使えるIDは次のようになっているようです
IDを指定してキャラクターを変更できます。
試しにずんだもんで音声合成すると
こんなコードになります。
出来上がった音声は
動画の方で確認してみて下さいね
VOICEBOX自体は
UI付きのソフトウェアで提供されていますが
大量のテキストを自動で音声化させたりしたい場合は
プログラムを使ってやるのが楽ですねー
そういう用途に使いたい方は
是非参考にしてみて下さい。
それでは。
音声合成できるソフトVOICEBOXを
Google Colabで使う方法についてです
解説動画はこちら
VOICEVOXとは
VOICEVOXは無料のテキスト読み上げソフトウェアで
ずんだもんなど、複数のキャラクターが存在する
音声合成ソフトです。
音声合成の精度もなかなかなものです。
インストール方法
下記のコマンドを貼り付けて実行です
!curl -sSfL https://raw.githubusercontent.com/VOICEVOX/voicevox_core/8cf307df4412dc0db0b03c6957b83b032770c31a/scripts/downloads/download.sh | bash -s cd voicevox_core/ !wget https://github.com/VOICEVOX/voicevox_core/releases/download/0.14.1/voicevox_core-0.14.1+cpu-cp38-abi3-linux_x86_64.whl !pip install voicevox_core-0.14.1+cpu-cp38-abi3-linux_x86_64.whl !wget https://raw.githubusercontent.com/VOICEVOX/voicevox_core/406f6c41408836840b9a38489d0f670fb960f412/example/python/run.py
音声合成のコマンド
下記のコマンドで音声合成が行えます
主にテキストとスピーカーIDの部分を
変えるだけです。
dirs = './open_jtalk_dic_utf_8-1.11' out_path = '../out.wav' text = 'テキスト' speaker_id = スピーカーID !python ./run.py --dict-dir $dirs --text $text --out $out_path --speaker-id $speaker_idout_pathで指定した場所に音声ファイルが出力されます。
スピーカーID
この指定で使えるIDは次のようになっているようです
キャラクター | 口調 | キャラクターID |
---|---|---|
四国めたん | ノーマル | 2 |
四国めたん | あまあま | 0 |
四国めたん | ツンツン | 6 |
四国めたん | セクシー | 4 |
四国めたん | ささやき | 36 |
四国めたん | ヒソヒソ | 37 |
ずんだもん | ノーマル | 3 |
ずんだもん | あまあま | 1 |
ずんだもん | ツンツン | 7 |
ずんだもん | セクシー | 5 |
ずんだもん | ささやき | 22 |
ずんだもん | ヒソヒソ | 38 |
春日部つむぎ | ノーマル | 8 |
雨晴はう | ノーマル | 10 |
波音リツ | ノーマル | 9 |
玄野武宏 | ノーマル | 11 |
玄野武宏 | 喜び | 39 |
玄野武宏 | ツンギレ | 40 |
玄野武宏 | 悲しみ | 41 |
白上虎太郎 | ふつう | 12 |
白上虎太郎 | わーい | 32 |
白上虎太郎 | びくびく | 33 |
白上虎太郎 | おこ | 34 |
白上虎太郎 | びえーん | 35 |
青山龍星 | ノーマル | 13 |
冥鳴ひまり | ノーマル | 14 |
九州そら | ノーマル | 16 |
九州そら | あまあま | 15 |
九州そら | ツンツン | 18 |
九州そら | セクシー | 17 |
九州そら | ささやき | 19 |
もち子さん | ノーマル | 20 |
剣崎雌雄 | ノーマル | 21 |
WhiteCUL | ノーマル | 23 |
WhiteCUL | たのしい | 24 |
WhiteCUL | かなしい | 25 |
WhiteCUL | びえーん | 26 |
後鬼 | 人間ver. | 27 |
後鬼 | ぬいぐるみver. | 28 |
No.7 | ノーマル | 29 |
No.7 | アナウンス | 30 |
No.7 | 読み聞かせ | 31 |
ちび式じい | ノーマル | 42 |
櫻歌ミコ | ノーマル | 43 |
櫻歌ミコ | 第二形態 | 44 |
櫻歌ミコ | ロリ | 45 |
小夜/SAYO | ノーマル | 46 |
ナースロボ_タイプT | ノーマル | 47 |
ナースロボ_タイプT | 楽々 | 48 |
ナースロボ_タイプT | 恐怖 | 49 |
ナースロボ_タイプT | 内緒話 | 50 |
IDを指定してキャラクターを変更できます。
試しにずんだもんで音声合成すると
こんなコードになります。
dirs = './open_jtalk_dic_utf_8-1.11' out_path = '../out.wav' text = 'どうも、ずんだもんです。よろしくね' speaker_id = 1 !python ./run.py --dict-dir $dirs --text $text --out $out_path --speaker-id $speaker_id from IPython.display import Audio Audio('../out.wav', autoplay=True)
出来上がった音声は
動画の方で確認してみて下さいね
VOICEBOX自体は
UI付きのソフトウェアで提供されていますが
大量のテキストを自動で音声化させたりしたい場合は
プログラムを使ってやるのが楽ですねー
そういう用途に使いたい方は
是非参考にしてみて下さい。
それでは。