【2023年最新版】OpenAIのText to Speech APIで日本語テキストを読み上げる

OpenAIのText to Speech APIで日本語テキストを読み上げる

POSTED BY
2023-12-16

MacOSにはPythonが最初から入っているので、Python版を使ってみる。

which python3
/usr/bin/python3

python3 -V
Python 3.9.6

which pip3
/usr/bin/pip3

OpenAIライブラリのインストール

pip3 install openai

OpenAIサイトでAPIの使用契約(クレジットカード登録)は済ませているものとする。

https://platform.openai.com/api-keys

APIキーを確認して環境変数にセットする。ここでは.profileや.bashrcにセキュア設定ファイル.bash_securesを読み込ませるようにしている。

cat >> .bash_secures
export OPENAI_API_KEY="YOUR-OPENAI-API-KEY"

chmod go-rwx .bash_secures

if [ -f "$HOME/.bash_secures" ]; then
  . "$HOME/.bash_secures"
fi

まずは公式サンプルをそのまま実行してみる。tts.pyというファイル名で保存するとする。

from pathlib import Path
from openai import OpenAI
client = OpenAI()

speech_file_path = Path(__file__).parent / "speech.mp3"
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)

response.stream_to_file(speech_file_path)

実行

pytyon3 tts.py

エラーが無ければspeech.mp3というファイルができるので、これをダブルクリックして読み上げ再生確認。inputを「あいうえおかきくけこ」と日本語に変更しても、ちゃんと読んだ。

https://platform.openai.com/docs/api-reference/audio/createSpeech

に、詳しいAPI仕様がある。これによると、入力テキストは4096文字までで、声優モデルはalloy, echo, fable, onyx, nova, and shimmerが設定できる。

日本語もちゃんと読むのだが、やはり上記全員アメリカ人とあって、読み上げが全部結婚式で誓わせるエセ神父っぽくなるのは仕方ないか。

【次の記事】Gmailでメールの振り分け（受信トレイ以外に置く）

【前の記事】【C++】std::bitsetでデータを2進数形式で表示し任意のビットがONかも調べる

Android 　iPhone/iPad 　Flutter 　MacOS 　Windows 　Debian 　Ubuntu 　CentOS 　FreeBSD 　RaspberryPI 　HTML/CSS 　C/C++ 　PHP 　Java 　JavaScript 　Node.js 　Swift 　Python 　MatLab 　Amazon/AWS 　CORESERVER 　Google 　仮想通貨　 LINE 　OpenAI/ChatGPT 　IBM Watson 　Microsoft Azure 　Xcode 　VMware 　MySQL 　PostgreSQL 　Redis 　Groonga 　Git/GitHub 　Apache 　nginx 　Postfix 　SendGrid 　Hackintosh 　Hardware 　Fate/Grand Order 　ウマ娘　将棋　ドラレコ

【WEBMASTER/管理人】

自営業プログラマーです。お仕事ください！
ご連絡は以下アドレスまでお願いします★

☆ServerNote.NETショッピング↓
ShoppingNote / Amazon.co.jp
☆お仲間ブログ↓
一人社長の不動産業務日誌

【キーワード検索】

【最近の記事】【全部の記事】

【Python】Spacyを使用して文章から出発地と目的地を抜き出す
HomeBrewでApache2を入れて自動起動つきで動かしPHPモジュールと連携する
macOSに標準付属のApacheを自動起動つきで動かす
HomeBrewでPostgreSQLを入れて自動起動つきで動かす
Windows11でSSHポートフォワードでSamba(139)ポートをbindできないエラー
システムで予約済みのパーティションを更新できませんでしたこのPCは現在Windows11のシステム要件を満たしていません
ソースからインストールしたPHPにPDO版MySQLとPostgreSQLを組み込む
apt upgradeしたあとnvidia-smiがダメになった場合
PoA(Proof of Authority)=Clique(クリーク)=を使用してGethのプライベートネットワークを複数ノードで組む
Fatal: Failed to register the Ethereum service: ethash is only supported as a historical component of already merged networks

【カテゴリーリンク】