豆包(Doubao)による画像生成モデル
汎用2.0-キャラクター特徴の保持(旧名称:汎用2.0S-主体保持)は、自社開発の主体保持機能を統合しています。この機能には、主体の外観保持と顔の特徴保持が含まれます。主体の外観情報には、人間、動物、物体など、さまざまな主体が含まれます。外観と顔の特徴は、画像生成プロセスにおいて入力されたテキストと共に作用し、参照画像内の主体と一致し、かつテキスト記述に合致した画像を生成します。
紹介:https://www.volcengine.com/docs/6791/1361423 Request
Example:Bearer {{YOUR_API_KEY}}
Body Params application/json
画像生成用のプロンプト:日本語と英語の両方で入力可能
プロンプト内で画像に書きたい文字を**引用符(" ")**で囲むと、文字の正 確性が向上します。(例:「クリスマスのポスターを作成し、ポスターには“Merry Christmas”と書かれている」)
画像ファイルのURL。このアルゴリズムには1枚の画像を入力する必要があります。
ランダムシードは、拡散の初期状態を決定する基盤として使用されます。デフォルト値は -1(ランダム)です。同じ正の整数をランダムシードとして設定し、他のパラメータが全て一致している場合、生成される画像は非常に高い確率で同じ結果になります。
デフォルト値:-1
テキスト記述の影響度
デフォルト値:3.5
取値範囲:[1, 10]
出力が画像リンクを返すかどうか(リンクの有効期限は24時間)
水印の位置は、以下の値を取ります:
0 - 右下隅
1 - 左下隅
2 - 左上隅
3 - 右上隅
デフォルトは0です
水印の言語は、以下の値を取ります:
0 - 中国語(AI生成)
1 - 英語(Generated by AI)
デフォルトは0です
水印の不透明度は、0から1の範囲で設定できます。1は完全に不透明を意味し、デフォルトは0.3です
生成画像のステップ数
デフォルト値:9
取値範囲:[1, 200]
生成画像の幅(超解像前のサイズ)
デフォルト値:512
取値範囲:[256, 768]
生成画像の高さ(超解像前のサイズ)
デフォルト値:512
取値範囲:[256, 768]
参照画像の主体外観の重み(値が大きいほど生成結果と参照画像内の主体の類似度が高くなる)
デフォルト値:0.7
取値範囲:[0, 1]
参照画像の顔特徴の重み(値が大きいほど生成結果と参照画像内の顔の類似度が高くなる)
デフォルト値:0.36
取値範囲:[0, 1]
推奨取値範囲:[0.2, 0.4]
true:テキストから画像生成 + AIGC超解像
false:テキストから画像生成
デフォルト値:true
{
"image_urls": ["https://xxx"],
"prompt": "千军万马",
"desc_pushback": true,
"seed": -1,
"scale": 3.5,
"ddim_steps": 9,
"width": 512,
"height": 512,
"cfg_rescale": 0.7,
"ref_ip_weight": 0.7,
"ref_id_weight": 0.36,
"use_sr": true,
"return_url": true,
"logo_info": {
"add_logo": false,
"position": 0,
"language": 0,
"opacity": 0.3,
"logo_text_content": "这里是明水印内容"
}
}
Request samples
curl --location --request POST 'https://api.302.ai/doubao/drawing/character' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--header 'Content-Type: application/json' \
--data-raw '{
"image_urls": ["https://xxx"],
"prompt": "千军万马",
"desc_pushback": true,
"seed": -1,
"scale": 3.5,
"ddim_steps": 9,
"width": 512,
"height": 512,
"cfg_rescale": 0.7,
"ref_ip_weight": 0.7,
"ref_id_weight": 0.36,
"use_sr": true,
"return_url": true,
"logo_info": {
"add_logo": false,
"position": 0,
"language": 0,
"opacity": 0.3,
"logo_text_content": "这里是明水印内容"
}
}'
Responses
application/json {
"completed_at": "",
"created_at": "",
"error": "",
"id": "",
"model": "",
"output": "",
"started_at": "",
"status": ""
}
Modified at 2025-01-14 09:39:28