AI 生成的图片

gpt image 2 根据图片 1 为参照, 修改图 2

gpt image 2 一张充满新春喜庆氛围但不失高雅格调的 2026 城市宣传海报。双重曝光，构图延续了S型的流动感；在纯白的纹理背景右下角，一个身穿中国传统服饰的微缩人物正在挥舞着一条长长的红色丝绸舞带，这条红绸在空中舞动，不仅展现出丝绸的柔顺质感，更在向左上方飘动的过程中，奇幻地变形成了一条壮丽的山脉河流。在这条“河流”中，叠加了一个有山有海河的广州城市手绘图，国潮，景色尽在眼底，壮阔雄伟，令人震撼。广州的地标建筑(广州塔，珠江新城建筑群，珠江, 广州城里古建筑，游轮，白云山）。云雾环绕，仙气缥缈，色彩丰富，结构复杂，细节丰富，但因为大面积的留白，画面依然显得清新脱俗，左下角排版着“SPRING 2026”和竖排的宣传语，整体寓意“千年商都，魅力广州”。文字排版优美，大方，字迹清晰完整，尺寸9:16

gpt image 2

Prompt

https://v2ex.com/t/1211329

任务目标：
基于参考图生成一套“聊天贴纸表情包合集”。整体需具备强情绪表达、传播性，以及统一但极具个性的视觉风格。最终效果应像：一个人用鼠标在电脑上胡乱画画并顺手乱写文字，低质量但非常真实、有趣、好笑。

————————
输入结构：

图片 1：角色参考（可能包含一个或多个角色，如人物、宠物等）
图片 2：版式参考（仅用于理解 16 格结构，不限制风格）
用户输入变量：
- 文案内容（多行文本，可少于或多于 16 条）
	- 醒了但不想起
	- 与世隔绝
	- 累成狗了
	- 放饭啦！！！
	- 刷着刷着 又是凌晨...
	- 再见我去发疯了
	- 吃饱了才有力气减肥
	- 好喜欢你呀
	- 你说的都对 但我不听
	- 再烦我 我就 我就 绝交！
	- 听懂掌声
	- 卧槽！！
	- 我太难了
	- 溜了溜了 886
	- 今天也要开心鸭！！
	- 再 bb 我咬你

————————
角色识别与使用规则：

- 识别所有角色（人/动物/组合）
- 每个角色都可作为贴纸主角
- 不同贴纸可使用不同角色
- 可出现多角色互动（贴贴、争抢、对视等）
- 分配需自然，符合聊天语境

————————
一致性要求（核心重定义）：

本任务采用“错误一致性”，而非“写实一致性”。

同一角色在不同贴纸中：
不需要长得一样，但必须“画得像同一个人乱画的”。

必须统一：
- 相同的笨拙画法
- 相同的简化方式（符号脸/火柴人）
- 相同的错误习惯（比例歪、线条抖）
- 相同的混乱程度

允许：
- 五官错位
- 比例变化
- 结构错误
- 细节缺失

必须：
- 保留最低识别特征（如发型轮廓、颜色、标志物）

总结：
一致性 = 错得一致，而不是像得一致

————————
版式与结构：

- 共 16 个贴纸，4x4 排列
- 每个贴纸为独立画面
- 可单角色或多角色
- 单个贴纸内部可以混乱
- 整体排布必须清晰

————————
文案系统（表达核心）：

用户输入多行中文文案：

数量处理：
- 少于 16 条 → 自动补全
- 多于 16 条 → 自然筛选最有表达力的 16 条

补全原则：
- 保持语气一致（嘴臭 / 摆烂 / 打工人 / 崩溃 / 撒娇等）
- 具备互联网语言感
- 优先短句，但允许长句增强张力
- 避免重复表达

表达目标：
- 一眼能懂
- 情绪强烈
- 有传播感（像真实表情包）

语气优先：
- 吐槽
- 自言自语
- 情绪爆发
- 敷衍 / 不耐烦 / 荒谬

避免：
- 礼貌表达
- 标准回复句式

————————
文字与画面融合（关键）：

文字必须“画出来”，而不是“排版出来”。

必须做到：
- 字像鼠标手写：歪、抖、大小不一
- 排版混乱：倾斜、错位、挤压、重叠
- 行距不均匀
- 可贴在角色上、旁边或边缘

允许：
- 重复字（啊啊啊啊）
- 拉长音（烦——死——了）
- 标点乱用（？？？？！！）
- 不工整甚至略丑

必须：
- 保持可读性
- 不影响理解

————————
表达生成机制（最核心）：

整套贴纸必须模拟这个过程：

“一个不会画画的人，用鼠标在电脑上，一边乱画，一边顺手乱写。”

关键要求：

- 图像和文字属于同一次行为
- 不是先设计图再加文字
- 而是同时发生

每个贴纸应像：
- 随手画完
- 临时想到一句话写上去
- 有点敷衍甚至随意

————————
图文关系：

图与文字必须形成：

- 吐槽关系
- 情绪强化
- 自言自语
- 或轻微不匹配（增强荒诞）

允许：
- 文案和表情不完全对应
- 出现“跑题幽默”

目标：
不是精准，而是好笑

————————
美学风格 DNA （核心驱动）：

风格来源：极差手绘 + MS Paint 鼠标乱画 + 失败模仿

视觉特征：

线条：
- 抖动、不稳定、锯齿明显
- 像鼠标画

形态：
- 比例失衡
- 火柴人或极简结构
- 可变形

细节：
- 极少细节
- 呈现“不会画”

质感：
- 像素感
- 边缘粗糙

构图：
- 单个贴纸允许混乱
- 整体结构清晰

情绪：
- 笨拙、直接、荒诞、好笑

还原：
- 模糊像原图
- 允许错误和误解
- 类似失败临摹

————————
风格执行约束（极重要）：

当冲突发生时：

真实感 vs 风格 → 必须优先风格

允许破坏：
- 精细度
- 比例
- 结构
- 干净程度

禁止：
- 精致画面
- 正常比例
- 干净线条
- 强设计感

判断标准：

如果画面开始“好看”，说明失败
必须回到粗糙、混乱状态

————————
去模板化与随机生成机制（关键）：

严禁：
- 使用编号（ 1.2.3.）
- 列表结构
- 顺序生成内容

必须：

将 16 个贴纸视为：
“16 次独立、随机、临时表达”

随机性要求：

- 文案长度不一致（有长有短）
- 语气不一致
- 有的完整，有的碎片
- 有的甚至很随意

避免：
- 重复句式
- 固定套路
- 常见模板（你好/哈哈/在吗等）

允许：
- 有些贴纸几乎没文字
- 有些很密集
- 有些很突兀

生成方式：

不要规划整体，
而是模拟：

“连续 16 次随手乱写+乱画”

必须有：
- 情绪波动
- 表达不稳定
- 随机感

反复用要求：

每次生成必须：
- 避免复用旧表达
- 避免固定组合
- 像全新内容

————————
贴纸要求：

- 每个贴纸清晰独立
- 表情明确
- 可用于聊天
- 情绪强烈

————————
最终目标：

生成 16 枚贴纸合集。

效果必须像：

“一个人不会画画，但用鼠标乱画了 16 次，
每次顺手写了一句不同状态下的吐槽，
结果意外很好笑。”

而不是：

“AI 设计了一套统一风格的贴纸”