1简介

1.1服务能力简介

天幕的图片生成图片功能,以一张参考图为起点,擅长在高度保留其核心特征(特别是特定对象或场景的精准细节)的同时,进行可控的创意调整。它不仅能确保人物ID的高度一致,精确控制人物的姿态,更能对画面中的物品边缘和景深进行单点精准调控。其核心优势在于超越简单的风格模仿,实现高度还原——通过针对性保留如人物姿势、轮廓等关键结构信息,达到“仿佛模特就在眼前”的真实效果。这种对画面主体(如商品)边缘与景深的精细掌控能力,为用户提供了高度可控的“半自由创作”空间,特别适用于需要极致精准度的应用场景。

1.2效果展示

原图

prompt

生成图片

参考主体: 一个男士在大峡谷紧握双臂

参考姿势: 日式动漫篮球场有一个男孩正在打球,樱花飘落边线。

参考边缘: 奇幻童话风格,果实用荧光粉、蓝,光影朦胧,松鼠像童话里的森林精灵。

参考景深: 扁平插画风中式古塔,简洁色块,明快色调。

2Prompt engine

提示词=参考图描述+保留要素 + 修改/新增指令

  • 图生图的核心在于基于一张参考图进行修改或再创作。因此,图生图的提示词框架需要在文生图框架的基础上,增加对参考图的描述、明确需要保留和修改的元素。
  • 参考图描述:用1-2句话概括图片的核心内容(主体、动作、场景)。
  • 保留要素: 明确列出希望AI在生成新图时必须保留的元素或特征。
  • 修改/新增指令: 清晰、具体地描述你想要改变或添加的内容。

参数名称

参数值

是否必须

示例

备注

Content-Type

application/json

X-Prod-Id

123

X-User-Id

wsid

body:

名称

类型

是否必须

默认值

备注

其他信息

wsid

integer

必须

用户ID

callback

string

非必须

算法结果回调url地址:例如 http://www.wondershare.cn/fx

priority

integer

非必须

算法优先级,0-普通级,1-付费级

params

string

非必须

透明参数

units_value

integer

必须

积分扣减单元

prompt

string

必须

正面提示词内容

width

integer

必须

生成图片的宽, 单位像素

height

integer

必须

生成图片的高, 单位像素

batch_size

integer

必须

生成图片数量,范围1-8

control_intensity

number

必须

控制强度, 0-1,浮点数

control_type

string

必须

输入控制类型,分别对应: 0 - 轮廓控制(边缘) 1 - 姿势控制 2 - 角色控制(主体) 3 - 景深控制

init_image

string

非必须

原图图像地址, 图像格式JPG/PNG, 这个是进行图像识别前的图片 control_type为 2 (主体控制的时候必传)

reference_image

string

必须

参考图像地址, 图像格式JPG/PNG, 输入给模型里的是进行图像识别后的图片

drive

string

非必须

如果输出的图片、视频等数据用云存储输出,此字段必填,json字符串类型 示例如下: { "space_id": 11111, // 云存储空间id "file_dest_path": "/path/sss", // 云存储存储路径(目录) "file_tag": // 文件标签 [ { "key": "key1", "value": "value1" }, { "key": "key2", "value": "value2" } ] }

3.3返回数据

名称

类型

是否必须

默认值

备注

其他信息

code

number

必须

错误码

msg

string

必须

错误信息

data

object

非必须

备注:

3.4完整示例