从灵感到上架：用 AI 图像生成制作微信表情包完整指南

本文最后更新于 2026年2月15日晚上

故事要从一个深夜的群聊说起。

那晚，TDP 群里又是一番热闹景象——有人在分享刚踩过的技术坑，有人在调侃“给大佬递茶”，还有人甩出一张灵魂画手级别的表情包，配文“代码能跑就行”。我盯着屏幕傻笑，心想：要是能有一套专属于我们社群的表情包该多好？

这个念头其实藏了很久。我向来想做几枚微信表情，偏巧自认手拙，胸中意象只能闷着，又碍于情面，不便叨扰画师朋友。直到有一天，我在技术群里看到有人用 AI 生成了一张惊艳的插画，画风细腻，中文文字清晰可辨——这在以前几乎是不可能的事。

那一刻，我意识到：时代又变了。

尤其是 Google 新出的 Nano Banana 模型，竟把绘图之事，变得如饮一杯凉白开般轻巧。于是，这篇文章便诞生了——记录我从萌生想法到表情包成功上架的完整旅程。

Nano Banana

Nano Banana 是 Google DeepMind 于 2025 年 8 月 25 日发布的原生图像生成模型，这个俏皮的代号源于它在 LMArena 匿名评测中的惊艳表现——当时以神秘身份参赛，却以压倒性优势击败了一众竞品，引发社区热议。

它实际上是 Gemini 2.5 Flash Image 的别称，专为速度和效率而生。而它的“大哥” Nano Banana Pro（即 Gemini 3 Pro Image Preview）则面向专业创作场景，支持更复杂的指令理解和高保真文本渲染。

Nano Banana 和 Gemini 的关系:

为了让你更清晰地理解这个“香蕉家族”的族谱，我画了一张关系图：

flowchart LR
    subgraph Google["🏢 Google DeepMind"]
        direction LR
        G25["Gemini 2.5 系列"]
        G3["Gemini 3 系列"]
    end
    
    subgraph Models["📦 图像生成模型"]
        direction LR
        subgraph Flash["⚡ Flash 分支"]
            G25F["Gemini 2.5 Flash"]
            G25FI["Gemini 2.5 Flash Image<br/>📅 2025.08.25"]
        end
        
        subgraph Pro["🎯 Pro 分支"]
            G3P["Gemini 3 Pro"]
            G3PI["Gemini 3 Pro Image Preview<br/>📅 2025.11.20"]
        end
    end
    
    subgraph Banana["🍌 Nano Banana 家族（LMArena 评测代号）"]
        direction LR
        NB["Nano Banana<br/>🚀 速度优先 | 1K输出"]
        NBP["Nano Banana Pro / Banana 2<br/>🎨 质量优先 | 支持4K输出"]
    end
    
    G25 --> G25F --> G25FI
    G3 --> G3P --> G3PI
    
    G25FI -.->|"别称"| NB
    G3PI -.->|"别称"| NBP
    
    NB -->|"进化"| NBP

    style G25FI fill:#4CAF50,stroke:#2E7D32,color:#fff
    style G3PI fill:#2196F3,stroke:#1565C0,color:#fff
    style NB fill:#FFC107,stroke:#FF8F00,color:#000
    style NBP fill:#FF9800,stroke:#E65100,color:#fff
    style Google fill:#E8F5E9,stroke:#4CAF50
    style Models fill:#E3F2FD,stroke:#2196F3
    style Banana fill:#FFF8E1,stroke:#FFC107

简单来说：

Nano Banana 是 Gemini 2.5 Flash Image 在 LMArena 匿名评测时的代号，主打快速生成，约 12 秒出图
Nano Banana Pro 是 Gemini 3 Pro Image Preview 的代号，主打专业品质，支持 4K 输出和高级文本渲染

Nano Banana Pro

Banana 2

如果你在一些第三方桥接接口中看到 Banana 2 的选项，别困惑——它其实就是 Nano Banana Pro 的另一个马甲，对应 Google 官方的 Gemini 3 Pro Image Preview 模型。

说实话，这命名逻辑确实让人挠头：第一代 Nano Banana 基于 Gemini 2.5 Flash Image，怎么第二代就跳到 Gemini 3 Pro Image Preview 了？Gemini 3 Flash 去哪儿了？

答案藏在产品定位里：Nano Banana Pro 并非 Flash 系列的简单升级，而是一个全新的 Pro 级图像生成模型。它需要 Gemini 3 Pro 的“思考后出图”推理能力来支撑 4K 输出、复杂指令理解等高级功能——这些特性与 Flash 系列“速度优先”的定位完全相悖。所以，与其说是“跳级”，不如说是开辟了一条新赛道。

模型	图像生成	说明
Gemini 2.5 Flash Image	✅	即初代 Nano Banana，主打快速生成
Gemini 3 Pro Image Preview	✅	即 Nano Banana Pro / Banana 2，主打专业品质
Gemini 3 Flash	❌	定位为快速文本推理，暂无图像生成能力

眼见为实

说了这么多，不如直接看效果。毕竟，”纸上得来终觉浅，绝知此事要躬行“。

如果你想找灵感或学习别人的 Prompt 技巧，强烈推荐这个网站：

NanobananaPrompt.org

Demo 参考样例

我照着网站上的参考提示词试了试，效果如下：

按样例提示词生成的图片

看到这里，你是不是也跃跃欲试了？

纸上得来终觉浅

操作前提

可能有朋友会问：”为什么不用 ComfyUI + Flux？那不是更专业吗？“

确实，ComfyUI 是个强大的工具，之前在 CNB 上也有看到相当完善的仓库：

ComfyUI CNB

但对于”只想快速做几张表情包“的我来说，Nano Banana 的优势太明显了——速度快、质量稳、操作简单，最重要的是：不用折腾环境。

不想折腾环境

让我用一张表格来说明为什么我最终选择了 Nano Banana：

对比维度	ComfyUI	Nano Banana Pro
上手难度	⭐⭐⭐⭐ 较高需安装软件、配置环境、下载模型、学习节点连接	⭐ 极低打开网页/App，输入文字即可生成
硬件要求	需要本地 GPU（建议 12G+ 显存）或租用云算力	无需本地算力，API 云端处理
工作流复杂度	需要搭建多节点工作流： LLM 生成提示词 → 图像生成 → 后处理	一句话描述，直接出图
角色一致性	需要额外配置 LoRA 或 IP-Adapter 等插件	✅ 原生支持角色一致性
中文文字渲染	❌ 传统模型普遍存在乱码问题	✅ 业界最强，支持繁体、简体中文
学习成本	需要学习 ComfyUI 操作、节点逻辑、提示词工程	几乎为零，会打字就能用
适合人群	专业设计师、需要精细控制的创作者	普通用户、快速出图需求、非技术人员

这些对表情包制作来说简直是刚需——毕竟，表情包上的文字如果变成乱码，那画面太美我不敢想。

如何调用

工具选好了（使用 Nano Banana 模型），接下来是怎么用的问题。主要有两条路：

官方渠道：订阅 Google DeepMind 高级会员或 Google One 会员，可以免费体验 Nano Banana Pro，但有生成频率限制和水印。想要无水印版本，需要额外调用 API 服务：Gemini Developer API 价格
第三方桥接：使用 cherryin 等非官方 API 服务

作为一个同时使用多个 AI 平台的“杂食用户”，每个平台都订阅的话钱包会哭泣😢。所以我选择了第三方桥接的方式，配合 Cherry Studio 聚合多平台 AI 服务，省心又省钱：

Cherry Studio 聚合多平台 AI 服务

实际使用效果：

调用 API，设计 Git 有关的表情包

好了，工具链准备就绪，是时候进入正题了。本次的表情包生成，就是使用第三方桥接方式，配合 Cherry Studio 调用 Nano Banana Pro 生成表情包。

制作思路

在动手之前，提前规划一下，用 AI 制作表情包主要有两种思路：

flowchart LR
    A[🎨 AI 表情包制作] --> B[统一角色风格]
    
    B --> C[自由生成场景/动作]
    B --> D[参考表情包姿态模仿]
    
    C --> E[📦 整理并上架]
    D --> E

    classDef mainNode fill:#e3f2fd,stroke:#1976d2,stroke-width:2px,color:#000
    classDef methodA fill:#e8f5e9,stroke:#388e3c,stroke-width:2px,color:#000
    classDef methodB fill:#fff3e0,stroke:#f57c00,stroke-width:2px,color:#000
    classDef finalNode fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px,color:#000

    class A mainNode
    class C methodA
    class D methodB
    class E finalNode

两种思路的核心都是：先建立统一的角色风格，再基于该风格进行扩展创作。区别在于后续怎么“玩”：

思路一（自由派）：通过文字描述场景和动作，让 AI 自由发挥生成表情
思路二（参考派）：找一张喜欢的表情包，让 AI 模仿它的姿态和构图，进行风格迁移

我选择了思路一，因为我想让表情包更具有随机性，带有 TDP 社群独特的“气质”。

表情包的生成

终于到了激动人心的实操环节！整个流程可以拆解为三步：

设计角色：生成一个风格统一的表情包人物，最好有三视图作为参考
批量生成：基于角色生成 15 张以上的表情包（微信上架的最低要求）
后期处理：用 Photoshop、Affinity 等工具抠图、调整（Nano Banana 暂不支持透明背景输出）

接下来，就让我带你回顾一下，我是如何给腾讯云 TDP 生成这套表情包的。

腾讯云 TDP 表情包

缘起：为什么做这套表情包？

说起来也有趣。

作为一个重度表情包用户，我在 TDP 群里待久了，发现这个社群有着独特的“梗文化”：技术讨论时的热烈氛围、给大佬递橙汁的温情传统、代码 review 时的会心吐槽……这些瞬间太鲜活了，我想用表情包把它们“定格”下来。

TDP 群内交流 Next 漏洞

于是，一个念头冒了出来：做一套专属于 TDP 的表情包，让这些有趣的瞬间变成可以反复使用的“文化符号”。

壹步：设计标准角色

万事开头难，角色设计是整套表情包的“灵魂”。我给自己定了几条原则：

简洁可爱：线条简单、特征明显，在手机上缩小后依然能一眼认出
表情丰富：五官比例要适合夸张表达，哭、笑、怒、萌都要 hold 住
主题鲜明：融入 TDP 的元素——紫色主色调、代码元素、开发者气质

经过反复调整，最终的提示词是这样的：

当前腾讯云有一个开发者组织，logo 见图。组织日常为：
1. 对接腾讯云产品团队，更专业、更及时地响应您的提问或建议
2. 优先体验产品新功能，让您在业务发展中始终保持技术领先优势
3. 定期组织线上线下的活动，帮助您更好地了解和使用腾讯云产品

请设置两个人物，作为吉祥物。分别为 Q版女生和男生，主色调为紫色，提供三视图和图纸

生成的标准角色形象

小贴士：建议多生成几张，从中挑选最满意的作为“基准角色”。大模型的输出充满随机性，这既是挑战也是惊喜——有时候它会给你意想不到的灵感。

比如下面这些“落选选手”，虽然没被选中，但各有各的可爱：

生成的随机角色形象

貳步：批量生成表情

有了基准角色，接下来就是“量产”环节。核心思路是：用基准角色作为参考图，配合场景描述生成不同的表情。

整个流程可以用这张图来概括：

flowchart LR
    A[🎭 基准角色] --> B{生成方式}
    B -->|自由描述| C[📝 场景/动作<br/>「本次演示」]
    B -->|姿态参考| D[🖼️ 参考图<br/>「可选」]
    C --> E[🎨 AI 生成]
    D --> E
    E --> F[✂️ 抠图处理]
    F --> G[📦 成品表情]

    style A fill:#e3f2fd,stroke:#1976d2,color:#000
    style B fill:#f3e5f5,stroke:#7b1fa2,color:#000
    style C fill:#e3f2fd,stroke:#1976d2,color:#000
    style D fill:#e3f2fd,stroke:#1976d2,color:#000
    style E fill:#fff3e0,stroke:#f57c00,color:#000
    style F fill:#fff3e0,stroke:#f57c00,color:#000
    style G fill:#e8f5e9,stroke:#388e3c,color:#000

案例一：给大佬倒橙汁

TDP 群里有个传统：当有人解答了技术难题，大家会发“给大佬倒橙汁”表示感谢。这个梗必须安排上！

我截取了基准角色中的女性形象，配合以下提示词：

基于图一人物的形象，生成一个表情包，人物在弯腰倒橙汁，并且配图上需要要气泡聊天框，上面写着: “给大佬倒橙汁”。其他要求如下:
1. 图片卡通，风趣幽默，展示群内欢快氛围。
2. 人物动作匹配目标场景，可以加一些点缀。保持可爱，人物手指五根。人物全身，注意代码元素。
3. 背景使用绿色，便于后续抠图。

生成的喝橙汁表情包

第一张图出来了！不过仔细看，人物周围有一圈白边，这会给后续抠图带来麻烦。于是我在下一张的提示词里加上了“人物和物体周围不要有白边”。

案例二：让我 review 一下

程序员的日常少不了 code review。当群友发来一段代码求助时，这张表情包就派上用场了：

基于图一的人物形象，生成类似于图二的表情包，人物在使用 Git 进行了代码的合并，现在正在检录代码，解决冲突，配图上需要要气泡聊天框，上面写着: “让我 review 一下”。其他要求如下:
1. 图片卡通，风趣幽默，展示群内欢快氛围。
2. 人物动作匹配目标场景，可以加一些点缀。保持可爱，人物手指五根。人物全身，注意代码元素。
3. 背景使用绿色，便于后续抠图。人物和物体周围不要有白边。

生成的 review 代码表情包

案例三：这好像可以优化

TDP 群里总有热心成员帮腾讯云官方“挑刺”——发现 UI 不合理的地方就会提出来。这种“建设性吐槽”也值得一张表情包：

基于图一的人物形象，生成类似于图二的表情包，生成一个表情包，人物在思考，并指出前端 UI 的不合理，配图上需要要气泡聊天框，上面写着: “这好像可以优化”。其他要求如下:
1. 图片卡通，风趣幽默，展示群内欢快氛围。
2. 人物动作匹配目标场景，可以加一些点缀。保持可爱，人物手指五根。人物全身，注意代码元素。
3. 背景使用绿色，便于后续抠图。人物和物体周围不要有白边。

生成的优化前端 UI 表情包