アプリケーション開発ポータルサイト
ServerNote.NET
カテゴリー【OpenAI/ChatGPTMacOSUbuntu
OpenAIのText to Speech APIで日本語テキストを読み上げる
POSTED BY
2023-12-16

MacOSにはPythonが最初から入っているので、Python版を使ってみる。

which python3
/usr/bin/python3

python3 -V
Python 3.9.6

which pip3
/usr/bin/pip3

OpenAIライブラリのインストール

pip3 install openai

OpenAIサイトでAPIの使用契約(クレジットカード登録)は済ませているものとする。

https://platform.openai.com/api-keys

APIキーを確認して環境変数にセットする。ここでは.profileや.bashrcにセキュア設定ファイル.bash_securesを読み込ませるようにしている。

cat >> .bash_secures
export OPENAI_API_KEY="YOUR-OPENAI-API-KEY"

chmod go-rwx .bash_secures

if [ -f "$HOME/.bash_secures" ]; then
  . "$HOME/.bash_secures"
fi

まずは公式サンプルをそのまま実行してみる。tts.pyというファイル名で保存するとする。

from pathlib import Path
from openai import OpenAI
client = OpenAI()

speech_file_path = Path(__file__).parent / "speech.mp3"
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)

response.stream_to_file(speech_file_path)

実行

pytyon3 tts.py

エラーが無ければspeech.mp3というファイルができるので、これをダブルクリックして読み上げ再生確認。inputを「あいうえおかきくけこ」と日本語に変更しても、ちゃんと読んだ。

https://platform.openai.com/docs/api-reference/audio/createSpeech

に、詳しいAPI仕様がある。これによると、入力テキストは4096文字までで、声優モデルはalloy, echo, fable, onyx, nova, and shimmerが設定できる。

日本語もちゃんと読むのだが、やはり上記全員アメリカ人とあって、読み上げが全部結婚式で誓わせるエセ神父っぽくなるのは仕方ないか。

※本記事は当サイト管理人の個人的な備忘録です。本記事の参照又は付随ソースコード利用後にいかなる損害が発生しても当サイト及び管理人は一切責任を負いません。
※本記事内容の無断転載を禁じます。
【WEBMASTER/管理人】
自営業プログラマーです。お仕事ください!
ご連絡は以下アドレスまでお願いします★

【キーワード検索】