概要

utayomiは、VoiceVoxエンジンを使用して日本語テキストを自然な音声に変換するテキスト読み上げAPIです。

認証

すべてのAPIリクエストにはAPIキーによる認証が必要です。APIキーを Authorization ヘッダーに含めてください:

Authorization: Bearer YOUR_API_KEY

クイックスタート

シンプルなPOSTリクエストでテキストから音声を生成できます:

curl -X POST https://api.utayomi.com/v1/synthesis \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"text": "こんにちは", "speaker": 1}'

音声合成

POST /v1/synthesis

テキストを音声に変換します。

リクエストボディ

パラメータ必須説明
textstringはい合成するテキスト(最大1000文字)
speakerintegerいいえスピーカーID(デフォルト: 1)
speednumberいいえ読み上げ速度 0.5〜2.0(デフォルト: 1.0)

レスポンス

WAV形式(audio/wav)の音声データを返します。

スピーカー

GET /v1/speakers

利用可能なボイススピーカーの一覧を取得します。

レスポンス

{
  "speakers": [
    { "id": 1, "name": "ずんだもん", "styles": [...] },
    { "id": 2, "name": "四国めたん", "styles": [...] }
  ]
}

エラー処理

APIは標準的なHTTPステータスコードを返します:

ステータス説明
200成功
400Bad Request - 無効なパラメータ
401Unauthorized - 無効または欠落しているAPIキー
429Too Many Requests - レート制限超過
500Internal Server Error - サーバー内部エラー