wan2.2-s2v（デジタルヒューマン生成）

POST

/aliyun/api/v1/services/aigc/image2video/video-synthesis

デジタルヒューマンwan2.2-s2vモデルは、1枚の画像と音声から、自然な動きで話す・歌う・演技する動画を生成できます。

音声駆動: 入力された人の音声により、静止画像の人物が口の動き、表情、動作を音声と同期して再現します。

多様なシーン: 「話す」、「歌う」、「演技する」の3つの口パクシーンに対応しています。

人物イメージの多様性：実写（肖像、半身、全身）やアニメキャラクターに対応しています。

出力動画の解像度：480P、720Pの2種類の解像度オプションを提供します。

価格：480P：0.1 PTC/秒
価格：720P：0.2 PTC/秒

Request

Header Params

Body Params application/json

Example

{
    "model": "wan2.2-s2v",
    "input": {
        "image_url": "https://img.alicdn.com/imgextra/i3/O1CN011FObkp1T7Ttowoq4F_!!6000000002335-0-tps-1440-1797.jpg",
        "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/iaqpio/input_audio.MP3"
    },
    "parameters": {
        "resolution": "480P"
    }
}

Request Code Samples

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location 'https://api.302.ai/aliyun/api/v1/services/aigc/image2video/video-synthesis' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.2-s2v",
    "input": {
        "image_url": "https://img.alicdn.com/imgextra/i3/O1CN011FObkp1T7Ttowoq4F_!!6000000002335-0-tps-1440-1797.jpg",
        "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250825/iaqpio/input_audio.MP3"
    },
    "parameters": {
        "resolution": "480P"
    }
}'

Responses

🟢200成功

application/json

Bodyapplication/json

Example

{
    "request_id": "6196e0f2-30f4-92fd-b554-591de5192d62",
    "code": "InvalidParameter",
    "message": "url error, please check url！"
}

Modified at 2025-12-18 07:22:40

wan2.2-animate-mix（動画フェイススワップ）

Tasks（タスク結果を取得）