前置说明
- 画布编号:节点内 title 后缀数字(如 7 批处理、7.1 图像生成);ID 为节点唯一 blockID
- 整体七大阶段:入参读取→文本分镜拆解→全局角色提炼→批量 TTS + 批量生图流水线→素材整合代码组装→剪映分层合成 + 关键帧动画→输出草稿链接结束
- 分辨率统一:576 宽 ×1024 高(9:16 竖屏短视频),统一画风:国风工笔、古朴淡雅,规避真人 / 外国人
一、入口读取、文本预处理阶段(文案分镜、角色提炼)
开始|起始节点
输出:auto_text、zhuti 完整入参下发全流程节点
功能:接收外部故事文本链接与视频主题,作为工作流全局数据源
作用:整条工作流唯一启动入口

1read|文件读取插件
输出:data(完整故事纯文本内容)
功能:读取云端 txt 文件,提取无格式原文
作用:获取原始故事文案,供给分镜大模型使用

2 大模型_分镜
输出:scenes 列表,列表每项 {“cap”:”单镜字幕”}
功能:首句单独 1 个分镜,后续每两句拆分 1 镜,不修改删减原文,输出标准 JSON 分镜数组
作用:把长篇故事拆分为独立字幕分镜,适配批量绘图、配音循环
3 大模型_角色 / 故事信息提炼
输出:desc 全局统一人物、场景、国风氛围描述文本
功能:汇总所有分镜情节,提炼统一角色外貌、环境、整体画风关键词
作用:保证全片人物画风统一,避免各镜头画面割裂
4 输出(中间提示)
输出:前端提示文本
功能:页面打印「开始生成分镜画面提示词..」
作用:告知用户当前执行步骤,可视化进度

5 大模型_图像提示词
输出:outputList 数组,包含 cap 字幕 + desc_promopt 绘图词
功能:批量为每个分镜生成国风工笔详细画面描述,固定古朴淡雅工笔风格
作用:批量生成合规 AI 绘画提示词,供给批量绘图容器

6 输出(中间提示)
输出:前端提示文本
功能:页面打印「开始生成视频配图,请耐心等待… 耗时较长,若长时间无响应,可尝试 “刷新页面” 或可点击下方 “历史查询” 按钮查看视频结果」

二、批量音画批处理容器(7 批处理)
7 批处理|批量循环容器
输出:image_list 全镜头图片链接数组、link_list 配音音频数组、duration_list 音频时长数组
功能:批量上限 200、并发 1,内部串行执行绘图、风控重绘、语音合成、时长解析,汇总三类素材列表
作用:统一承载所有分镜循环任务,批量生成配图与旁白音频

7.1 图像生成
输出:data 原图链接、msg 日志信息
功能:固定 576×1024 1K 国风工笔尺寸,负面词屏蔽外国人、真人,生成原画
作用:生成分镜基础插画素材

7.2 选择器(条件分支)
输出:链接有效走 true 通路;空 / 风控拦截走 false 通路
功能:判断图片生成是否成功,自动分流两条执行逻辑
作用:搭建绘图失败自动兜底重绘流程

7.3 绘画提示词优化大模型
输出:改写后安全合规绘图提示词
功能:保留画面核心画面元素,修改敏感违规描述,输出可过审 Prompt
作用:解决原图风控拦截,为重绘提供可用绘图指令

7.4 图像生成(兜底重绘)
输出:兜底重绘图片 data 链接、msg 日志
功能:尺寸、画风、负面屏蔽规则和 7.1 完全一致,重新生成画面
作用:原图失效时备用镜头插画素材

7.5 代码(图片容错合并)
输出:image_url 最终可用单镜图片链接
功能:逻辑判断原图存在则优先使用,为空替换为重绘图
作用:每个分镜输出唯一有效配图,消除空白镜头

7.6speech_synthesis 语音合成
输出:data.link 配音音频 URL、data.duration 音频秒数
功能:固定擎苍音色、语速 1,文本转人声旁白音频
作用:生成单镜头对应配音与原始时长数据

7.7get_audio_duration 获取音频时长
输出:duration 微秒整数时长
功能:读取音频时长并换算为剪映微秒标准单位
作用:提供字幕、图片对齐的精准时间基准

三、片头独立背景支线
8 大模型_图像提示词_首图背景
输出:desc_promopt 无人物国风背景绘图词
功能:仅生成不含人物的开篇静态工笔背景描述
作用:制作片头静态底图专用提示词
9 图像生成_第一张无人物背景图
输出:data 静态背景图片 URL
功能:1024×1024 纯白留白国风工笔尺寸,无人物画面
作用:产出视频开篇底层静态背景素材

10 写动态描述词(图生视频)
11 视频生成(片头动态背景)
输出:5 秒 720p 无水印国风动态短视频 URL
功能:静态图片结合运镜文案生成动态片头视频
作用:产出视频最底层片头动态背景图层

四、全局数据整合代码
12 代码|全局素材数据处理
输出:audioData 配音 JSON、bgAudioData 背景音乐 JSON、kcAudioData 开场音效 JSON、imageData 画面图层 JSON、text_timelines 字幕时间轴、text_captions 分段字幕、title_list 标题文本、title_timelimes 标题时间轴、roleImgData 角色图层 JSON
功能:
- 按音频时长分配图片起止时间,奇偶镜头区分缩放入场动画;
- 自动拆分超长字幕,单行上限 25 字,生成微秒级字幕时间轴;
- 内置固定背景音乐、开场音效链接,自动匹配全片总时长;
- 封装角色封面、标题、主画面、音频多层时间线结构
- 作用:全流程素材整合枢纽,输出剪映插件可直接导入的标准化图层数据
输出:前端提示文本
功能:页面打印「视频编排中,即将完成…」
作用:告知用户进入剪映图层自动编排环节

五、剪映草稿基础创建
14create_draft 创建草稿
输出:draft_url 剪映草稿唯一访问链接
功能:初始化 1024×576 竖版空白剪映工程草稿
作用:所有音频、图片、字幕、动画统一画布载体

六、剪映图层批量添加流水线
15add_audios 批量主配音
输出:草稿新增主配音音频轨道
功能:批量导入分镜旁白音频,绑定对应起止时间
作用:搭建视频第一层人声旁白音轨







22 代码_关键帧
输出:keyFrames 画面缩放关键帧 JSON
功能:首图三段缩放动画,其余镜头交替 1.0↔1.5 线性推拉关键帧
作用:生成全程画面缓慢缩放运镜动画数据

23add_keyframes 添加关键帧
输出:绑定缩放动画后的草稿地址
功能:将缩放关键帧批量绑定至对应画面片段
作用:实现全片画面缓慢推拉动态效果

24caption_infos 主字幕数据生成
输出:字幕配置 infos 字符串
功能:预设江湖字体、白色深色描边、底部居中样式
作用:生成旁白字幕标准化配置参数

25caption_infos_标题 2 个字
输出:标题字幕 infos 配置字符串
功能:标题弹入入场动画,单独标题样式
作用:生成开篇两字标题字幕配置

26add_captions 批量添加主字幕
输出:视频底层旁白字幕文字图层
功能:批量导入字幕,与人声时间同步,居中显示
作用:同步人声展示旁白字幕,提升可读性

七、草稿保存与最终输出
27save_draft 保存草稿
输出:已永久保存的 draft_url、保存提示信息
功能:永久存储草稿内所有音频、图片、字幕、关键帧动画图层
作用:生成完整可编辑剪映视频工程

输出:格式化文本「视频草稿地址, 请使用剪映小下载:{{draft_url}}」
功能:对外输出可直接打开的剪映草稿链接
作用:向用户返回工作流最终成品

结束|流程终止节点
输出:整条工作流最终返回值 draft_url 草稿地址
功能:接收最终草稿链接,标记全流程所有节点运算全部完成,终止工作流
作用:工作流闭环节点,统一对外返回视频草稿地址














暂无评论内容