Run in Apifox
音声を入力言語に文字起こしします。 文字起こしAPIは、文字起こししたい音声ファイルを入力として受け取り、希望する音声文字起こし出力ファイル形式を指定します。現在、複数の入力および出力ファイル形式をサポートしています。 Request
Example: Bearer {{YOUR_API_KEY}}
Body Params multipart/form-data
転写対象の音声ファイルは、以下のいずれかの形式である必要があります:mp3、mp4、mpeg、mpga、m4a、wav、または webm。
モデルのID。現在はwhisper-1のみ利用可能です。
オプションのテキストで、モデルのスタイルを導いたり、前の音声セグメントを継続したりするために使用します。プロンプトは音声の言語と一致する必要があります。
文字起こし出力の形式。以下から選択してください:json、text、srt、verbose_json、またはvtt。
サンプリング温度、0から1の間。高い値(例:0.8)はより無作為な出力を生成し、低い値(例:0.2)はより焦点を絞った確定的な出力を生成します。0に設定すると、モデルは対数確率 を使用して、特定のしきい値に達するまで自動的に温度を上げます。 入力音声の言語。ISO-639-1形式で入力言語を提供すると、精度と速度が向上します。
Request samples curl --location --request POST 'https://api.302.ai/v1/audio/transcriptions' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--form 'file=@""' \
--form 'model="whisper-1"' \
--form 'prompt=""' \
--form 'response_format="json"' \
--form 'temperature="0"' \
--form 'language=""'
Responses application/json Generate Code
{
"text" : "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
Modified at 2025-01-09 09:23:17