デジタルヒューマンwan2.2-s2vモデルは、1枚の画像と音声から、自然な動きで話す・歌う・演技する動画を生成できます。音声駆動: 入力された人の音声により、静止画像の人物が口の動き、表情、動作を音声と同期して再現します。多様なシーン: 「話す」、「歌う」、「演技する」の3つの口パクシーンに対応しています。人物イメージの多様性:実写(肖像、半身、全身)やアニメキャラクターに対応しています。出力動画の解像度:480P、720Pの2種類の解像度オプションを提供します。価格:480P:0.1 PTC/秒
価格:720P:0.2 PTC/秒
Request
Body Params application/json
{
"model": "wan2.2-s2v",
"input": {
"image_url": "https://img.alicdn.com/imgextra/i3/O1CN011FObkp1T7Ttowoq4F_!!6000000002335-0-tps-1440-1797.jpg",
"audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/iaqpio/input_audio.MP3"
},
"parameters": {
"resolution": "480P"
}
}
Request Code Samples
curl --location --request POST 'https://api.302.ai/aliyun/api/v1/services/aigc/image2video/video-synthesis' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--header 'Content-Type: application/json' \
--data-raw '{
"model": "wan2.2-s2v",
"input": {
"image_url": "https://img.alicdn.com/imgextra/i3/O1CN011FObkp1T7Ttowoq4F_!!6000000002335-0-tps-1440-1797.jpg",
"audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/iaqpio/input_audio.MP3"
},
"parameters": {
"resolution": "480P"
}
}'
Responses
application/json {
"request_id": "6196e0f2-30f4-92fd-b554-591de5192d62",
"code": "InvalidParameter",
"message": "url error, please check url!"
}
Modified at 2025-08-28 02:44:35