从灵感到上架:用 AI 图像生成制作微信表情包完整指南
本文最后更新于 2026年1月4日 晚上
故事要从一个深夜的群聊说起。
那晚,TDP 群里又是一番热闹景象——有人在分享刚踩过的技术坑,有人在调侃“给大佬递茶”,还有人甩出一张灵魂画手级别的表情包,配文“代码能跑就行”。我盯着屏幕傻笑,心想:要是能有一套专属于我们社群的表情包该多好?
这个念头其实藏了很久。我向来想做几枚微信表情,偏巧自认手拙,胸中意象只能闷着,又碍于情面,不便叨扰画师朋友。直到有一天,我在技术群里看到有人用 AI 生成了一张惊艳的插画,画风细腻,中文文字清晰可辨——这在以前几乎是不可能的事。
那一刻,我意识到:时代又变了。
尤其是 Google 新出的 Nano Banana 模型,竟把绘图之事,变得如饮一杯凉白开般轻巧。于是,这篇文章便诞生了——记录我从萌生想法到表情包成功上架的完整旅程。
Nano Banana
Nano Banana 是 Google DeepMind 于 2025 年 8 月 25 日发布的原生图像生成模型,这个俏皮的代号源于它在 LMArena 匿名评测中的惊艳表现——当时以神秘身份参赛,却以压倒性优势击败了一众竞品,引发社区热议。
它实际上是 Gemini 2.5 Flash Image 的别称,专为速度和效率而生。而它的“大哥” Nano Banana Pro(即 Gemini 3 Pro Image Preview)则面向专业创作场景,支持更复杂的指令理解和高保真文本渲染。
Nano Banana 和 Gemini 的关系:
为了让你更清晰地理解这个“香蕉家族”的族谱,我画了一张关系图:
flowchart LR
subgraph Google["🏢 Google DeepMind"]
direction LR
G25["Gemini 2.5 系列"]
G3["Gemini 3 系列"]
end
subgraph Models["📦 图像生成模型"]
direction LR
subgraph Flash["⚡ Flash 分支"]
G25F["Gemini 2.5 Flash"]
G25FI["Gemini 2.5 Flash Image<br/>📅 2025.08.25"]
end
subgraph Pro["🎯 Pro 分支"]
G3P["Gemini 3 Pro"]
G3PI["Gemini 3 Pro Image Preview<br/>📅 2025.11.20"]
end
end
subgraph Banana["🍌 Nano Banana 家族(LMArena 评测代号)"]
direction LR
NB["Nano Banana<br/>🚀 速度优先 | 1K输出"]
NBP["Nano Banana Pro / Banana 2<br/>🎨 质量优先 | 支持4K输出"]
end
G25 --> G25F --> G25FI
G3 --> G3P --> G3PI
G25FI -.->|"别称"| NB
G3PI -.->|"别称"| NBP
NB -->|"进化"| NBP
style G25FI fill:#4CAF50,stroke:#2E7D32,color:#fff
style G3PI fill:#2196F3,stroke:#1565C0,color:#fff
style NB fill:#FFC107,stroke:#FF8F00,color:#000
style NBP fill:#FF9800,stroke:#E65100,color:#fff
style Google fill:#E8F5E9,stroke:#4CAF50
style Models fill:#E3F2FD,stroke:#2196F3
style Banana fill:#FFF8E1,stroke:#FFC107
简单来说:
- Nano Banana 是 Gemini 2.5 Flash Image 在 LMArena 匿名评测时的代号,主打快速生成,约 12 秒出图
- Nano Banana Pro 是 Gemini 3 Pro Image Preview 的代号,主打专业品质,支持 4K 输出和高级文本渲染

Banana 2
如果你在一些第三方桥接接口中看到 Banana 2 的选项,别困惑——它其实就是 Nano Banana Pro 的另一个马甲,对应 Google 官方的 Gemini 3 Pro Image Preview 模型。
说实话,这命名逻辑确实让人挠头:第一代 Nano Banana 基于 Gemini 2.5 Flash Image,怎么第二代就跳到 Gemini 3 Pro Image Preview 了?Gemini 3 Flash 去哪儿了?
答案藏在产品定位里:Nano Banana Pro 并非 Flash 系列的简单升级,而是一个全新的 Pro 级图像生成模型。它需要 Gemini 3 Pro 的“思考后出图”推理能力来支撑 4K 输出、复杂指令理解等高级功能——这些特性与 Flash 系列“速度优先”的定位完全相悖。所以,与其说是“跳级”,不如说是开辟了一条新赛道。
| 模型 | 图像生成 | 说明 |
|---|---|---|
| Gemini 2.5 Flash Image | ✅ | 即初代 Nano Banana,主打快速生成 |
| Gemini 3 Pro Image Preview | ✅ | 即 Nano Banana Pro / Banana 2,主打专业品质 |
| Gemini 3 Flash | ❌ | 定位为快速文本推理,暂无图像生成能力 |
眼见为实
说了这么多,不如直接看效果。毕竟,”纸上得来终觉浅,绝知此事要躬行“。
如果你想找灵感或学习别人的 Prompt 技巧,强烈推荐这个网站:

我照着网站上的参考提示词试了试,效果如下:

看到这里,你是不是也跃跃欲试了?

操作前提
可能有朋友会问:”为什么不用 ComfyUI + Flux?那不是更专业吗?“
确实,ComfyUI 是个强大的工具,之前在 CNB 上也有看到相当完善的仓库:
但对于”只想快速做几张表情包“的我来说,Nano Banana 的优势太明显了——速度快、质量稳、操作简单,最重要的是:不用折腾环境。

让我用一张表格来说明为什么我最终选择了 Nano Banana:
| 对比维度 | ComfyUI | Nano Banana Pro |
|---|---|---|
| 上手难度 | ⭐⭐⭐⭐ 较高 需安装软件、配置环境、下载模型、学习节点连接 |
⭐ 极低 打开网页/App,输入文字即可生成 |
| 硬件要求 | 需要本地 GPU(建议 12G+ 显存)或租用云算力 | 无需本地算力,API 云端处理 |
| 工作流复杂度 | 需要搭建多节点工作流: LLM 生成提示词 → 图像生成 → 后处理 |
一句话描述,直接出图 |
| 角色一致性 | 需要额外配置 LoRA 或 IP-Adapter 等插件 | ✅ 原生支持角色一致性 |
| 中文文字渲染 | ❌ 传统模型普遍存在乱码问题 | ✅ 业界最强,支持繁体、简体中文 |
| 学习成本 | 需要学习 ComfyUI 操作、节点逻辑、提示词工程 | 几乎为零,会打字就能用 |
| 适合人群 | 专业设计师、需要精细控制的创作者 | 普通用户、快速出图需求、非技术人员 |
这些对表情包制作来说简直是刚需——毕竟,表情包上的文字如果变成乱码,那画面太美我不敢想。
如何调用
工具选好了(使用 Nano Banana 模型),接下来是怎么用的问题。主要有两条路:
- 官方渠道:订阅 Google DeepMind 高级会员或 Google One 会员,可以免费体验 Nano Banana Pro,但有生成频率限制和水印。想要无水印版本,需要额外调用 API 服务:Gemini Developer API 价格
- 第三方桥接:使用 cherryin 等非官方 API 服务
作为一个同时使用多个 AI 平台的“杂食用户”,每个平台都订阅的话钱包会哭泣😢。所以我选择了第三方桥接的方式,配合 Cherry Studio 聚合多平台 AI 服务,省心又省钱:

实际使用效果:

好了,工具链准备就绪,是时候进入正题了。本次的表情包生成,就是使用第三方桥接方式,配合 Cherry Studio 调用 Nano Banana Pro 生成表情包。
制作思路
在动手之前,提前规划一下,用 AI 制作表情包主要有两种思路:
flowchart LR
A[🎨 AI 表情包制作] --> B[统一角色风格]
B --> C[自由生成场景/动作]
B --> D[参考表情包姿态模仿]
C --> E[📦 整理并上架]
D --> E
classDef mainNode fill:#e3f2fd,stroke:#1976d2,stroke-width:2px,color:#000
classDef methodA fill:#e8f5e9,stroke:#388e3c,stroke-width:2px,color:#000
classDef methodB fill:#fff3e0,stroke:#f57c00,stroke-width:2px,color:#000
classDef finalNode fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px,color:#000
class A mainNode
class C methodA
class D methodB
class E finalNode
两种思路的核心都是:先建立统一的角色风格,再基于该风格进行扩展创作。区别在于后续怎么“玩”:
- 思路一(自由派):通过文字描述场景和动作,让 AI 自由发挥生成表情
- 思路二(参考派):找一张喜欢的表情包,让 AI 模仿它的姿态和构图,进行风格迁移
我选择了思路一,因为我想让表情包更具有随机性,带有 TDP 社群独特的“气质”。
表情包的生成
终于到了激动人心的实操环节!整个流程可以拆解为三步:
- 设计角色:生成一个风格统一的表情包人物,最好有三视图作为参考
- 批量生成:基于角色生成 15 张以上的表情包(微信上架的最低要求)
- 后期处理:用 Photoshop、Affinity 等工具抠图、调整(Nano Banana 暂不支持透明背景输出)
接下来,就让我带你回顾一下,我是如何给 腾讯云 TDP 生成这套表情包的。

缘起:为什么做这套表情包?
说起来也有趣。
作为一个重度表情包用户,我在 TDP 群里待久了,发现这个社群有着独特的“梗文化”:技术讨论时的热烈氛围、给大佬递橙汁的温情传统、代码 review 时的会心吐槽……这些瞬间太鲜活了,我想用表情包把它们“定格”下来。

于是,一个念头冒了出来:做一套专属于 TDP 的表情包,让这些有趣的瞬间变成可以反复使用的“文化符号”。
壹步:设计标准角色
万事开头难,角色设计是整套表情包的“灵魂”。我给自己定了几条原则:
- 简洁可爱:线条简单、特征明显,在手机上缩小后依然能一眼认出
- 表情丰富:五官比例要适合夸张表达,哭、笑、怒、萌都要 hold 住
- 主题鲜明:融入 TDP 的元素——紫色主色调、代码元素、开发者气质
经过反复调整,最终的提示词是这样的:
1 | |

小贴士:建议多生成几张,从中挑选最满意的作为“基准角色”。大模型的输出充满随机性,这既是挑战也是惊喜——有时候它会给你意想不到的灵感。
比如下面这些“落选选手”,虽然没被选中,但各有各的可爱:

貳步:批量生成表情
有了基准角色,接下来就是“量产”环节。核心思路是:用基准角色作为参考图,配合场景描述生成不同的表情。
整个流程可以用这张图来概括:
flowchart LR
A[🎭 基准角色] --> B{生成方式}
B -->|自由描述| C[📝 场景/动作<br/>「本次演示」]
B -->|姿态参考| D[🖼️ 参考图<br/>「可选」]
C --> E[🎨 AI 生成]
D --> E
E --> F[✂️ 抠图处理]
F --> G[📦 成品表情]
style A fill:#e3f2fd,stroke:#1976d2,color:#000
style B fill:#f3e5f5,stroke:#7b1fa2,color:#000
style C fill:#e3f2fd,stroke:#1976d2,color:#000
style D fill:#e3f2fd,stroke:#1976d2,color:#000
style E fill:#fff3e0,stroke:#f57c00,color:#000
style F fill:#fff3e0,stroke:#f57c00,color:#000
style G fill:#e8f5e9,stroke:#388e3c,color:#000
案例一:给大佬倒橙汁
TDP 群里有个传统:当有人解答了技术难题,大家会发“给大佬倒橙汁”表示感谢。这个梗必须安排上!
我截取了基准角色中的女性形象,配合以下提示词:
1 | |

第一张图出来了!不过仔细看,人物周围有一圈白边,这会给后续抠图带来麻烦。于是我在下一张的提示词里加上了“人物和物体周围不要有白边”。
案例二:让我 review 一下
程序员的日常少不了 code review。当群友发来一段代码求助时,这张表情包就派上用场了:
1 | |

案例三:这好像可以优化
TDP 群里总有热心成员帮腾讯云官方“挑刺”——发现 UI 不合理的地方就会提出来。这种“建设性吐槽”也值得一张表情包:
1 | |

可以看到,Banana Pro 的效果相当不错——角色风格保持一致,文字清晰可读,整体画风也很统一。但 AI 毕竟不是万能的,有些细节还需要人工调整,这就引出了下一步:后期处理。
叄步:后期处理(抠图)
由于 Nano Banana 目前不支持透明背景输出,我们需要手动抠图。这里我推荐 Affinity Photo:https://www.affinity.studio/
为什么选它?两个原因:
- 我在 2020 年左右入手了 Affinity Photo 一代永久版,用了好几年,操作已经很熟练了👀;
- 更重要的是——Affinity 第三代开始全面免费了!这么良心的软件,不推荐说不过去😁。
抠图完成后,记得把尺寸调整为 512×512 像素,保存为 PNG 格式,这是微信表情包的标准规格:

表情包上架
表情包做好了,最后一步就是上架。流程其实很简单:
- 登录 微信表情开放平台
- 注册成为“表情设计师”(需要实名认证)
- 创建“表情专辑”并上传作品
我的设计师主页长这样:

创建 TDP 表情包专辑时的界面:

踩坑:审核被打回
这里必须分享一个“血泪教训”——我的第一次提交被打回了。
原因有两个:
- 表情包里出现了 Emoji:聊天气泡可以有,但不能包含系统 Emoji
- 出现了人物代号:比如“TDP 小邵”、“TDP 老欧”这种带人名的文字是不允许的
所以提交前一定要仔细检查,避免在这些细节上翻车。
最后,展示一下这次 Demo 的成品(目前还未正式上架):

END
回顾这次创作之旅,最让我感慨的不是 AI 技术有多强大,而是:工具降低了门槛,但创意的源泉依然是生活本身。
这套表情包之所以能“活”起来,是因为背后有真实的故事——TDP 群里那些深夜的技术讨论、给大佬递橙汁的温暖传统、代码 review 时的欢乐吐槽……每一张表情包都是一个“切片”,记录着这个社群独特的气质。
用 AI 制作表情包,最大的优势就是降低了设计门槛——即便你从未学过绘画,也能借助提示词让创意落地。但请记住:AI 是画笔,你才是画家。
感谢 TDP 的小伙伴们,是你们的笑点与智慧,让这套表情包有了灵魂。

愿 AI 绘图技术继续进化,也愿每位读者都能创作出让自己心动、让他人会心一笑的表情包。
如果这篇文章对你有所启发,欢迎加入我们的开发者交流群 812198734,一起碰撞灵感,携手前行。
下一个爆款表情包,也许就出自你手。
