Text-to-Audio（テキスト生成音楽）

Obsolete

POST

/sd/v2beta/audio/stable-audio-2/text-to-audio

Stable Audioは、テキストによる説明から最長3分間の高品質な音楽や効果音を生成できます。サンプリングレートは44.1kHzのステレオです。最適な生成結果を得るために、効果的なプロンプトの書き方についてはプロンプトガイドをご参照ください。

Stable Audio 2.5：高速・高品質・長尺の音楽およびオーディオ生成
最先端のオーディオ生成モデルで、最長3分間・44.1kHzステレオの作品を生成可能です。Stable Audio 2.5はテキストからオーディオ、オーディオからオーディオ、オーディオ修復のワークフローに対応しています。クリエイターはサウンドをアップロードし、自然言語のプロンプトで新しい楽器、スタイル、ジャンルへ変換できます。音楽制作、映画レベルのサウンドデザイン、リミックスに最適です。

Stable Audio 2.0：高品質なオーディオ生成
テキストからオーディオ、オーディオからオーディオのために設計されており、同様に最長3分間・44.1kHzステレオの生成が可能です。Stable Audio 2.0は、アイデア出し、音楽デモ、アンビエントサウンドスケープに最適です。シンプルなプロンプトから繊細で長尺な出力を求めるプロフェッショナルクリエイター向けに最適化されています。

価格：0.02PTC/クレジット

stable-audio-2は通常20～23クレジット（0.4～0.46ptc）消費します
stable-audio-2.5は固定で20クレジット（0.4ptc）消費します

Request

Query Params

Header Params

Body Params multipart/form-data

Request Code Samples

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location 'https://api.302.ai/sd/v2beta/audio/stable-audio-2/text-to-audio?response_format=URL' \
--header 'Authorization: Bearer ' \
--form 'prompt="バイオリンとピアノを使用した映画のようなオーケストラ楽曲";type=text/plain' \
--form 'duration="120";type=text/plain' \
--form 'seed="４２";type=text/plain' \
--form 'steps="50";type=text/plain' \
--form 'cfg_scale="7";type=text/plain' \
--form 'model="stable-audio-2.5";type=text/plain' \
--form 'output_format="mp3";type=text/plain'

Responses

🟢200成功

application/json

Bodyapplication/json

Example

{
    "content_type": "application/json",
    "filename": "stability_audio_1768448513.mp3",
    "size": 151,
    "url": "https://file.302.ai/gpt/imgs/20260115/cdf9889a61711c38a9e7865fd5c865bb.mp3"
}

Modified at 2026-04-10 09:55:00

タスク結果を取得

Audio-to-Audio（参照生成音楽）