Stable Audioは、テキストによる説明から最長3分間の高品質な音楽や効果音を生成できます。サンプリングレートは44.1kHzのステレオです。最適な生成結果を得るために、効果的なプロンプトの書き方についてはプロンプトガイドをご参照ください。Stable Audio 2.5:高速・高品質・長尺の音楽およびオーディオ生成
最先端のオーディオ生成モデルで、最長3分間・44.1kHzステレオの作品を生成可能です。Stable Audio 2.5はテキストからオーディオ、オーディオからオーディオ、オーディオ修復のワークフローに対応しています。クリエイターはサウンドをアップロードし、自然言語のプロンプトで新しい楽器、スタイル、ジャンルへ変換できます。音楽制作、映画レベルのサウンドデザイン、リミックスに最適です。Stable Audio 2.0:高品質なオーディオ生成
テキストからオーディオ、オーディオからオーディオのために設計されており、同様に最長3分間・44.1kHzステレオの生成が可能です。Stable Audio 2.0は、アイデア出し、音楽デモ、アンビエントサウンドスケープに最適です。シンプルなプロンプトから繊細で長尺な出力を求めるプロフェッショナルクリエイター向けに最適化されています。stable-audio-2は通常20~23クレジット(0.4~0.46ptc)消費します
stable-audio-2.5は固定で20クレジット(0.4ptc)消費します
Request
Body Params multipart/form-data
Request Code Samples
curl --location --request POST 'https://api.302.ai/sd/v2beta/audio/stable-audio-2/text-to-audio?response_format=URL' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--form 'prompt="バイオリンとピアノを使用した映画のようなオーケストラ楽曲";type=text/plain' \
--form 'duration="120";type=text/plain' \
--form 'seed="42";type=text/plain' \
--form 'steps="50";type=text/plain' \
--form 'cfg_scale="7";type=text/plain' \
--form 'model="stable-audio-2.5";type=text/plain' \
--form 'output_format="mp3";type=text/plain'
Responses
application/json Modified at 2025-09-29 02:35:21