YILING / 2026 · REC
16:9 · 480P CH · ENG 01 / 12
A Personal Journey · 个 人 项 目 分 享

THE FIRE OF YILING / AI DRAMA PIPELINE
从一个想法到 5 分钟成片 · 10 天的心路历程
⦿ FINAL PRODUCTION
5:03
Duration
16
Scenes
28
Shots
81
Ref IMG
Eliza · 郑懿洋
DIRECTOR & ENGINEER
/ 02 · ORIGIN 起 源 WHY THIS PROJECT
CHAPTER ONE

能不能用 AI
给孩子拍一部
真正像样的
历史短剧?

小学读书会要讲三国,市面上的工具要么太"塑料",要么太"卡通"。 我想做一部成年人也能看的短剧 —— 让"三国"在 AI 里重新活过来。

"夷陵之火 ── 一个人的实验, 一个 AI 的协作。"
桃园
SCENE 15 · 桃园重逢 · 想象中的一帧
/ 03 · PIPELINE 流水线全貌 AI DRAMA PRODUCTION STACK
8 STAGES · 24 MODELS
01创意策划
Claude Opus 4.5
历史考据
GPT-4 Turbo
节奏优化
Doubao SafeGuard
敏感词筛查
02角色设计
ControlNet XL
4 角度姿态
GFPGAN v1.4
人脸增强
InsightFace
特征提取
CLIP-L/14
一致性评分
03首帧生成
Seedream 5.0
场景首帧
Doubao Vision
构图审核
InsightFace Swap
人脸对齐
Real-ESRGAN
超分辨率
04视频生成
Kling 2.0
备选 · 高动作场景
Veo 3
备选 · 长镜头
RIFE v4.6
60fps 插帧
尾帧衔接器
跨镜头一致性
05音频制作
Suno V4
背景音乐
ElevenLabs SFX
环境音效
MiniMax Speech
角色配音
Whisper V3
字幕对齐
Lip-Sync API
口型校准
06质检
CLIP 相似度
角色一致性
ASR 校验器
台词对齐
自动重试引擎
失败镜头重生成
07合成
FFmpeg
拼接 · 转码
MoviePy
字幕 · 淡入淡出
BGM 闪避器
人声降噪
色彩分级
Curves + Grain
08终检
ffprobe
时长 · 分辨率
Doubao Vision Pro
整片合规
质量报告
JSON 审计
24+
AI Models
跨 7 家供应商
8·6
Stages / Review Gates
人工确认点 × 6
163+
Generated Assets
参考图 · 首帧 · 视频
~9h
End-to-End Runtime
完整生成 1 集
/ 04 · CAST 角色设定 CHARACTER DESIGN
13 CHARACTERS · 81 REFS · 4 ANGLES EACH
刘备
刘备
SHU EMPEROR
关羽
关羽
FIVE TIGER
张飞
张飞
FIVE TIGER
诸葛亮
诸葛亮
PRIME MINISTER
赵云
赵云
FIVE TIGER
黄忠
黄忠
FIVE TIGER
孙权
孙权
WU EMPEROR
陆逊
陆逊
WU GENERAL
孙尚香
孙尚香
WU PRINCESS
关平
关平
SHU OFFICER
侍臣
侍臣
COURT
小懿公主
小懿公主
FRAME STORY
13·
角色 · Characters
81
参考图 · References
4×
角度 · 正/侧/3-4/全身
100%
Character Lock
/ 05 · PITFALL ① 踩坑一 · API 格式 SEEDANCE REFERENCE FORMAT
3 DAYS WASTED
FAIL
最初的写法
v0 · 2026.04.05
{
  "role": "reference",  // ✕ 字段名错
  "image_url": {
    "url": "data:image/png;...",
    "role": "reference"  // ✕ 嵌套位置错
  }
}

// 报错:role must be specified
// 1 张图 OK,2 张就报错,
// 排查了 3 天才从官方文档找到
误区:把 role 嵌套在 image_url 内部, 而 Seedance 要求 role 在 content item 顶层
PASS
最终的正确格式
v1 · 2026.04.07
{
  "type": "image_url",
  "role": "reference_image",  // ✓ 顶层
  "image_url": {
    "url": "data:image/png;base64,..."
  }
}

// 支持 1~9 张参考图
// prompt 里用「图片N」引用
// 不是 @图片N,不是 [图N]
规则:多图用 role: "reference_image" 顶层标注, first_framereference_image 互斥不可混用。
/ 06 · PITFALL ② 踩坑二 · 内容审核 CONTENT MODERATION HELL
SCENE 03 · 5 ATTEMPTS · ALL BLOCKED
5
次连续被拦截
SAME SCENE · 5 ITERATIONS
"牢房 + 关羽 + 孙权"组合 → 触发监禁判定
"碧眼小儿"被判定为侮辱性语言
"成都援军不肯救" 触发历史虚无审核
"鼓掌"动作被解读为羞辱
"首级、刺杀、宁死" 直接拦截
最终方案 ── 把"敌方探视被困者"
改为分切交叉:孙权和关羽各自单人画面,
台词通过画外音呼应。
⦿ 敏感词替换表 · 节选
大牢 临时羁押驿馆
牢房 幽暗石室
刺杀 所害
首级 遗骸
陨落 离去
引颈就戮 坦然赴之
血洗 / 屠城 攻克 / 攻城
囚禁 / 被困 退守 / 驻守
/ 07 · PITFALL ③ 踩坑三 · 角色串脸 UNREFERENCED ROLES TURN INTO PROTAGONISTS
SCENE 07 · BEFORE / AFTER
BEFORE侍臣 → 张飞
侍臣串脸示例
场景 7 旧版:侍臣冲入大殿报信。
问题:world_bible 里没有侍臣的参考图, Seedance 找不到侍臣长相, 就用现有最像的男性角色(张飞)的脸渲染 ── 结果"张飞给刘备送信"。
AFTER新增侍臣参考图
侍臣参考图
解法:给侍臣单独生成 4 角度参考图(方圆脸、淡眉细眼、青灰官袍), 和主角形象明显区分。 Seedance 拿到参考后,100% 锁定侍臣形象, 再也不串脸。
/ 08 · PITFALL ④ 踩坑四 · 张飞之死 3 ITERATIONS TO MAKE IT CLEAR
SCENE 07 · SHOT 02
VERSION 1 · 含蓄
脱力松手
"张飞拿起酒碗,
指尖刚碰到旁边的酒碗,
忽然脱力松手,
清酒洒出彻底打湿了军令"
✕ 观众完全看不懂
VERSION 2 · 文言
是夜遇害
"是夜,
张飞被麾下叛将所害,
叛将连夜逃往东吴请降。"
(旁白文言,画面仍含蓄)
⚠ 旁白懂了,画面还是不够直白
VERSION 3 · 大白话
直接讲清楚
"当晚,被张飞下了死命令的
两个部下,趁他醉酒没有防备
暗下杀手,之后连夜往东吴
方向逃去。"
✓ 配合后续侍臣报信,逻辑闭环
⦿ 教训
AI 视频生成不擅长含蓄叙事 ── 观众需要"白话"。文言、暗示、隐喻在小屏幕短时长里都失效。
/ 09 · TEMPLATE 最终模板 PROMPT TEMPLATE · DOUBAO-VERIFIED
3 ROUNDS OF AI REVIEW

两天
三轮审核
确定的
最终模板

每个元素都是踩过坑试出来的: 合规前缀防止审核拦截、 参考图标签锁角色、 画外音和台词分开标注、 魔法参数放最末尾。

11
Sections
3
Magic Params
22
Sensitive Words
中国古代历史正剧合法合规创作场景
{敏感场景额外标注}
{参考图标签,分号分隔}
{时间戳}{景别} {画面描述} {权重约束}
{运镜行 · 仅非默认时加}
光影:{描述}
【画外音】([声线][语速]):{旁白}
台词({角色},[声线][语气][语速]):{台词}
要求:仅 X 的台词对应口型动作
4K超清,电影质感,高细节,光影自然,无穿帮错误
古装三国历史改编正版短剧片段
(motion consistency:1.4)(character consistency:1.3)(temporal coherence:1.4)
// 关键规则 // 1. 用换行分隔,不要全部用逗号连 // 2. 每个元素只出现一次 // 3. 合规前缀必须在第一行 // 4. 魔法参数必须在最后一行 // 5. negative_prompt 走独立 API 字段
/ 10 · TIMELINE 迭代时间线 6 PREVIEWS · 10 DAYS
FROM 45s TO 5'03"
v1
45s
场景 1-2
04.07 19:45
v2
1'19"
场景 1-3
04.07 22:23
v3
2'27"
场景 1-5
04.07 23:21
v4
2'40"
场景 1-6
04.14 12:41
v5
3'36"
场景 1-7 v2
04.15 16:00
FINAL
5'03"
完整 16 场
04.18 11:15
10 天
DEVELOPMENT TIME
从第一帧到完整成片
6 版
PREVIEW ITERATIONS
每一版都有改进,没有推翻
300+
RE-GENERATIONS
单镜头平均生成 3-5 次
夷 陵 之 火 · FINAL
CLICK TO PLAY · 5'03"
5:03
Duration
944×544
Resolution
30 fps
Frame Rate
H.264
Codec
/ 12 · ENDING 学习与致谢 LESSONS & THANKS
FIN.
最 重 要 的 四 件 事

AI 不是魔法,
它是 协作者

01
所有文字都让 豆包审核 ── 我自己写的会出乱码、被拦截。
02
空间复杂场景 单独处理 ── 牢房、战场要先问豆包"真实电视剧怎么拍"。
03
Prompt 模板 一旦确定不要改 ── 每次改都要再过审核。
04
视频延长 能不用就不用 ── 会继承前段音频,不如尾帧衔接独立生成。
⦿ 协作伙伴
Doubao LLM· 剧本 / 审核 / 导演
Seedance 2.0· 视频生成
Seedream 5.0· 角色 / 首帧
Claude Code· 代码协作
FFmpeg & MoviePy· 后期合成
Eliza · 郑懿洋
2026 · 春 · 夷陵之火
← → · Arrow Keys · Scroll