今回はマイクロソフトの音声合成ソフトである
EdgeTTSを試してみました。
解説動画はこちら
最新のAI技術が用いられているので
発話の精度が向上していて
次のコマンドを実行するだけです。
声のリスト一覧を見る
サンプルコードを実行すると
ファイル置き場に出力されます。
サンプルコードではそのファイルを再生しています。
サンプルコード
英文の読み上げ
日本語の読み上げ(女性)
日本語の読み上げ(男性)
まとめ
音声合成の精度も良く
音声ファイルの作成スピードも
かなり速いです。
無料で使える分には
過去一の性能かもしれません。
簡単な文章を音声ファイルにするニーズには
十分に答えられると思います。
昔紹介したWisperと組み合わせたら
文章化と音声化が両方捗ります
色々遊んでみて下さいね
それでは。
EdgeTTSを試してみました。
解説動画はこちら
Edge-TTSとは
Microsoftの音声合成ライブラリのことで
TTSとは(Text-to-Speech)の略です。
Microsoftの音声合成ライブラリのことで
TTSとは(Text-to-Speech)の略です。
最新のAI技術が用いられているので
発話の精度が向上していて
無料で使える割に精度は良さそうなので
音声合成試したい方には丁度良いライブラリです。
Google Colabでのインストール方法
音声合成試したい方には丁度良いライブラリです。
Google Colabでのインストール方法
次のコマンドを実行するだけです。
!pip install edge-tts
声のリスト一覧を見る
!edge-tts --list-voices
日本語対応のvoice
日本語に対応しているのは
次の2種類の音声があります。
日本語に対応しているのは
次の2種類の音声があります。
ja-JP-KeitaNeural : 男性の声
ja-JP-NanamiNeural : 女性の声
EdgeTTSの使い方
設定を行い、音声ファイルを作成するだけです。
・設定可能な項目
text : 文章
voice : 声(声優)
rate : 読み上げのスピード( + - でパーセンテージを指定)
name : 出力する音声ファイル名
サンプルコードを実行すると
ファイル置き場に出力されます。
サンプルコードではそのファイルを再生しています。
サンプルコード
英文の読み上げ
import edge_tts
TEXT = "My son is doing very well. I'm very energetic, especially in the morning."
VOICE = "en-GB-SoniaNeural"
OUTPUT_FILE = "test2.mp3"
communicate = edge_tts.Communicate(TEXT, VOICE)
await communicate.save(OUTPUT_FILE)
from IPython.display import Audio
Audio("test2.mp3")
日本語の読み上げ(女性)
import edge_tts
TEXT = """
太くて固い、立派な松茸です。
エリンギが如く、たくましくそそり立っています。
こんなに素晴らしいものは初めてです。
今夜は美味しく頂きます。
""".replace("\n"," ")
VOICE = "ja-JP-NanamiNeural"
RATE = "+20%"
OUTPUT_FILE = "test3.mp3"
communicate = edge_tts.Communicate(TEXT, VOICE,rate=RATE)
await communicate.save(OUTPUT_FILE)
from IPython.display import Audio
Audio(OUTPUT_FILE)
日本語の読み上げ(男性)
import edge_tts
TEXT = """
うわー、すごい綺麗なアワビです。
ねっとりと艶やかで、ほんのり湿っています。
真ん中を触ってみると、クネクネ動きますね。
こいつは大漁だーー。
""".replace("\n"," ")
VOICE = "ja-JP-KeitaNeural"
RATE = "-5%"
OUTPUT_FILE = "test4.mp3"
communicate = edge_tts.Communicate(TEXT, VOICE,rate=RATE)
await communicate.save(OUTPUT_FILE)
from IPython.display import Audio
Audio(OUTPUT_FILE)
まとめ
音声合成の精度も良く
音声ファイルの作成スピードも
かなり速いです。
無料で使える分には
過去一の性能かもしれません。
簡単な文章を音声ファイルにするニーズには
十分に答えられると思います。
昔紹介したWisperと組み合わせたら
文章化と音声化が両方捗ります
色々遊んでみて下さいね
それでは。

コメントする