wavespeed-ai/infinitetalk-fast/video-to-video
infiniteTalk/video-to-vedioは、入力の静止画動画と音声を組み合わせて新しい動画を作成します。口元の正確なシンクロを確保するとともに、頭部、顔、身体の動きを音声に合わせます。オプションのマスクやプロンプトにより、ユーザーはどの領域を動かすか、シーンの表現方法を細かく制御できます。モデルは視覚認識も保持し、自然で一貫した効果を実現します。既存のREST推論APIを利用可能で、最高のパフォーマンス、コールドスタートなし、手頃な価格です。3.
mask imageをアップロードして、どの領域を動かせるか制御(任意)
4.
スタイル、ポーズ、表現を指示するプロンプトを記述(任意)
7.
提出後、IDを使用してGETインターフェースから結果を取得
価格:
480p: 0.15 PTC/5秒; 最長10分
720p: 0.30 PTC/5秒; 最長10分* Request
Body Params application/json
{
"seed": 1725904444,
"audio": "https://d1q70pf5vjeyhc.cloudfront.net/media/92d2d4ca66f84793adcb20742b15d262/audios/1763289418138530583_0WdipEHS.mp3",
"video": "https://d1q70pf5vjeyhc.cloudfront.net/media/92d2d4ca66f84793adcb20742b15d262/videos/1763289377067922416_T6fb8qnk.mp4"
}
Request Code Samples
curl --location --request POST 'https://api.302.ai/ws/api/v3/wavespeed-ai/infinitetalk-fast/video-to-video' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
"seed": 1725904444,
"audio": "https://d1q70pf5vjeyhc.cloudfront.net/media/92d2d4ca66f84793adcb20742b15d262/audios/1763289418138530583_0WdipEHS.mp3",
"video": "https://d1q70pf5vjeyhc.cloudfront.net/media/92d2d4ca66f84793adcb20742b15d262/videos/1763289377067922416_T6fb8qnk.mp4"
}'
Responses
application/json {
"code": 200,
"message": "success",
"data": {
"id": "d04026e1a90a4e3dbd823239158f95d1",
"model": "wavespeed-ai/infinitetalk-fast/video-to-video",
"outputs": [],
"urls": {
"get": "https://api.302.ai/ws/api/v3/predictions/d04026e1a90a4e3dbd823239158f95d1/result"
},
"has_nsfw_contents": [],
"status": "created",
"created_at": "2025-11-21T07:52:16.669Z",
"error": "",
"executionTime": 0,
"timings": {
"inference": 0
}
}
}
Modified at 2025-12-19 07:18:22