概要

utayomiは、VoiceVoxエンジンを使用して日本語テキストを自然な音声に変換するテキスト読み上げAPIです。APIのベースURLは https://utayomi.com/api です。

認証

保護されたエンドポイントへのリクエストにはAPIキーによる認証が必要です。APIキーを Authorization ヘッダーに含めてください。レート制限: 1リクエスト/秒（Unkeyで管理）

Authorization: Bearer YOUR_API_KEY

クイックスタート

https://utayomi.com/api/v1/synthesis へのPOSTリクエストでテキストから音声を生成できます：

curl -X POST https://api.utayomi.com/v1/synthesis \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"text": "こんにちは", "speaker": 1}'

音声合成

POST /v1/synthesis

テキストを音声に変換します。

リクエストボディ

パラメータ	型	必須	説明
`text`	string	はい	合成するテキスト（最大1000文字）
`speaker`	integer	いいえ	スピーカーID（デフォルト: 1）
`speed`	number	いいえ	読み上げ速度 0.5〜2.0（デフォルト: 1.0）

レスポンス

WAV形式（audio/wav）の音声データを返します。

スピーカー

GET /v1/speakers

利用可能なボイススピーカーの一覧を取得します。

レスポンス

{
  "speakers": [
    { "id": 1, "name": "ずんだもん", "styles": [...] },
    { "id": 2, "name": "四国めたん", "styles": [...] }
  ]
}

エラー処理

APIは標準的なHTTPステータスコードを返します：

ステータス	説明
200	成功
400	Bad Request - 無効なパラメータ
401	Unauthorized - 無効または欠落しているAPIキー
429	Too Many Requests - レート制限超過（1リクエスト/秒、Unkeyで管理）
500	Internal Server Error - サーバー内部エラー