1简介
1.1服务能力简介
天幕的图片生成图片功能,以一张参考图为起点,擅长在高度保留其核心特征(特别是特定对象或场景的精准细节)的同时,进行可控的创意调整。它不仅能确保人物ID的高度一致,精确控制人物的姿态,更能对画面中的物品边缘和景深进行单点精准调控。其核心优势在于超越简单的风格模仿,实现高度还原——通过针对性保留如人物姿势、轮廓等关键结构信息,达到“仿佛模特就在眼前”的真实效果。这种对画面主体(如商品)边缘与景深的精细掌控能力,为用户提供了高度可控的“半自由创作”空间,特别适用于需要极致精准度的应用场景。
1.2效果展示
原图 |
prompt |
生成图片 |
|
参考主体: 一个男士在大峡谷紧握双臂 |
|
|
参考姿势: 日式动漫篮球场有一个男孩正在打球,樱花飘落边线。 |
|
|
参考边缘: 奇幻童话风格,果实用荧光粉、蓝,光影朦胧,松鼠像童话里的森林精灵。 |
|
|
参考景深: 扁平插画风中式古塔,简洁色块,明快色调。 |
|
2Prompt engine
提示词=参考图描述+保留要素 + 修改/新增指令
|
3API接入
3.1请求地址
https://open-api.wondershare.cc/v1/open/capacity/application/tm_reference_img2img
3.2请求参数
Method: POST
Headers
参数名称 |
参数值 |
是否必须 |
示例 |
备注 |
Content-Type |
application/json |
是 |
|
|
X-Prod-Id |
|
是 |
123 |
|
X-User-Id |
|
是 |
wsid |
|
body:
名称 |
类型 |
是否必须 |
默认值 |
备注 |
其他信息 |
wsid |
integer |
必须 |
|
用户ID |
|
callback |
string |
非必须 |
|
算法结果回调url地址:例如 http://www.wondershare.cn/fx |
|
priority |
integer |
非必须 |
|
算法优先级,0-普通级,1-付费级 |
|
params |
string |
非必须 |
|
透明参数 |
|
units_value |
integer |
必须 |
|
积分扣减单元 |
|
prompt |
string |
必须 |
|
正面提示词内容 |
|
width |
integer |
必须 |
|
生成图片的宽, 单位像素 |
|
height |
integer |
必须 |
|
生成图片的高, 单位像素 |
|
batch_size |
integer |
必须 |
|
生成图片数量,范围1-8 |
|
control_intensity |
number |
必须 |
|
控制强度, 0-1,浮点数 |
|
control_type |
string |
必须 |
|
输入控制类型,分别对应: 0 - 轮廓控制(边缘) 1 - 姿势控制 2 - 角色控制(主体) 3 - 景深控制 |
|
init_image |
string |
非必须 |
|
原图图像地址, 图像格式JPG/PNG, 这个是进行图像识别前的图片 control_type为 2 (主体控制的时候必传) |
|
reference_image |
string |
必须 |
|
参考图像地址, 图像格式JPG/PNG, 输入给模型里的是进行图像识别后的图片 |
|
drive |
string |
非必须 |
|
如果输出的图片、视频等数据用云存储输出,此字段必填,json字符串类型 示例如下: { "space_id": 11111, // 云存储空间id "file_dest_path": "/path/sss", // 云存储存储路径(目录) "file_tag": // 文件标签 [ { "key": "key1", "value": "value1" }, { "key": "key2", "value": "value2" } ] } |
|
3.3返回数据
名称 |
类型 |
是否必须 |
默认值 |
备注 |
其他信息 |
code |
number |
必须 |
|
错误码 |
|
msg |
string |
必须 |
|
错误信息 |
|
data |
object |
非必须 |
|
|
备注: |
3.4完整示例