Mac上のPython でDocomoの音声合成APIの音声データ(raw)をwavに保存する[AITalk]

以前の記事「docomoの音声合成APIの音声データ(Binary)をMacで再生する方法 (2つ) 」で試した Docomoの音声合成APIをMacのPythonからWavデータに保存できるようにしました。
(Windowsでは動きません)

環境

  • Mac OS : 10.11.4 (EI Capitan)
  • Python 3.4.1

前準備

docomo Developer supportに登録して、音声合成のAPI_KEYを取得しておく

使い方

1. 以下のソースを保存

ファイル名は適当でもOK。
以下、sample.py で保存したとします。

API_KEYは適時修正してください。

2. 保存フォルダの準備

sample.pyを保存した同じディレクトリ内に、 “cache”,”sound”のディレクトリを作成
書き込み権限を与えておくこと

{作業フォルダ}
├ sample.py
├ cache/
└ sound/

3. 実行

ターミナルで以下コマンドを実行

成功すれば、sound/*******.wav が保存され、再生できるはず
cache内のデータは削除してOK

パラメーターについて

合成音声の話者や読み上げ速度などはSSMLで調整可能となっています。

パラメーターはAITalkの音声合成デモンストレーション http://www.ai-j.jp/cloud/webapi/で試せます。

ただAPIではデモンストレーションの話者全員を使えないので気をつけること。
APIで使える話者は以下のみ

のぞみ、まき、すみれ、かほ、あかり、ななこ
せいじ、おさむ、ひろし、あんず、こうたろう

参考サイト)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


*