藏经人工作流-亲测资源

10小时前更新

图片[1]-藏经人工作流-亲测资源

薅社会主义羊毛请继续往下阅读

前置文案处理区

0. 开始

输入：外部触发参数（账号、原文案、素材配置、音量 / 分辨率参数）
输出：全局通用变量流
功能：工作流启动入口，接收用户外部传入全部配置数据
作用：统一分发参数给下游所有节点，是整条流程的数据源头

1. 文案文件文本提取 convert_file

输入：上传文档文件（txt/csv）
输出：纯文本字符串 wenan_text
功能：解析文档，剔除格式符号、换行冗余，提取干净文案
作用：支持文件批量导入文案，无需手动复制文字，适配长文案批量生成

2. 用户文案变量聚合

输入：文件提取文案、手动输入文案
输出：合并后完整文案变量 wenan
功能：双来源文案合并，去空值、去重复
作用：兼容「传文件」「手动打字」两种输入方式，统一下游文案数据源
【代码】

此处内容已隐藏，请评论后刷新页面查看.

3. 是否输入自己的文案（分支判断）

输入：总文案 wenan
输出：两条并行分支数据流
功能：条件分流判断

分支 1：无现成口播稿 → 走 AI 生成口播；

分支 2：自带口播文案 → 直接分割分句
作用：兼容两种业务场景，不用两套独立工作流，降低维护成本

4. AI 生成口播稿

输入：正文长文案
输出：口语化分段口播脚本
功能：大模型润色，书面文转适合配音的口语短句，自动拆分短句
作用：解决纯文章生硬、不适合配音的问题，自动适配短视频朗读节奏
【提示词】

此处内容已隐藏，请评论后刷新页面查看.

5. 口播稿智能分割 text_split

输入：#4 输出的 AI 生成口播完整文稿
输出：标准化分句文本数组 segments
功能：按标点、朗读时长阈值切割短句，统一分句长度
作用：将 AI 生成的完整口播稿拆分成单句，和 #6 原生口播分割输出格式统一，方便 #7 聚合

6. 口播智能分割 text_splitter

输入：现成口播文案
输出：分句文本数组 segments
功能：按标点、时长阈值自动切割短句，控制单句配音时长
作用：统一分句粒度，保证后续 TTS、画面分镜一一对应，音画同步

7. 正文文案聚合

输入：AI 生成口播分段、原生分割口播分段
输出：统一标准分段数组 segments
功能：合并两条分支的分句数据，标准化数组格式
作用：两条分流链路数据归一，下游 TTS、绘图节点只需要对接一套数据

8. 正文语音合成

输入：分段文本数组
输出：分段音频文件、单句时长、音频 URL 数组
功能：批量 TTS 语音合成，统一音色、语速、音量
作用：一次性生成全部口播配音，绑定每一句对应时长，为字幕、画面对齐提供时间基准

9. 提取正文 URL 为列表 audio

输入：TTS 合成原始音频数据
输出：结构化音频列表（音频地址、时长、序号）
功能：清洗 TTS 返回杂乱数据，规整成可遍历数组
作用：给时间轴、音频叠加节点提供标准化音频素材

10. 提取正文音频时间轴 audio

输入：结构化音频列表
输出：完整配音时间轴 timelines（起始时间、结束时间、对应文本）
功能：根据单句时长自动拼接全局时间线
作用：全流程音画同步核心基准，字幕、画面、音效全部基于该时间轴对齐

音频素材并行轨道（音效、BGM）

11. 键盘打字音效

输入：全局时长参数
输出：打字音效音频文件、时长数据
功能：生成通用打字背景音效素材
作用：正文画面叠加打字氛围感音效，提升视频观感

12. title 键盘打字音效

输入：片头标题时长
输出：标题专属打字音效
功能：独立生成片头打字音效，音量、节奏单独可调
作用：区分片头与正文音效，片头氛围感单独控制

13. 上传背景音乐 BGM

输入：BGM 素材文件、音量阈值
输出：全局背景音乐音频流
功能：加载通用背景音乐，自动裁剪匹配视频总时长
作用：全片底层背景音乐轨道，统一音量防盖过人声

14. title 背景音乐

输入：片头时长、标题 BGM 素材
输出：片头独立 BGM 音频
功能：片头专属背景音乐，与正文 BGM 分离控制
作用：片头使用差异化配乐，强化开篇记忆点

字幕、绘图提示词生成

15. 文案合并时间轴 wenan_ti

输入：分段文本、配音时间轴
输出：绑定文字 + 时间戳的完整字幕数组
功能：文本与起止时间一一绑定，生成标准字幕时间线
作用：批量字幕渲染节点直接读取，自动同步配音弹出字幕

16. 生成分镜提示词

输入：单句口播文本、文案关键词
输出：每一句对应的 AI 绘图提示词数组
功能：AI 根据台词生成匹配画面的文生图 Prompt
作用：实现一句台词对应一张配图，自动匹配文案内容，无需手动写绘图词
输入
【提示词】
此处内容已隐藏，请评论后刷新页面查看.

输出

17. 生成配图 / 视频提示词

输入：全文总文案、核心关键词
输出：封面、片头通用绘图 Prompt
功能：生成封面大图、片头背景图专用提示词
作用：独立管控封面视觉风格，和正文分镜画面区分开
输入
【提示词】
此处内容已隐藏，请评论后刷新页面查看.

批量分镜图像批处理体（18 系列循环子节点）

18.1 图像生成

输入：单句分镜绘图提示词
输出：单句配图图片
功能：循环批量文生图，逐句生成台词对应画面
作用：自动化批量生成视频全部正文画面，一句一图

18.2 选择器

输入：生成图片结果
输出：正常图片 / 空值标记
功能：判断图片是否生成成功，分流异常数据
作用：图像生成失败时自动分流，防止流程中断报错

18.3 bsd_border_mp4

输入：原始生成图片
输出：带边框、简易转场的短画面片段
功能：给静态图片加边框、淡入淡出转场，转成短视频片段
作用：静态图片动态化，避免画面生硬静止

18.4 主生成

输入：带边框画面片段、单句配音时长
输出：标准化画面素材（画面文件、时长、序号）
功能：统一画面尺寸、时长参数，规整素材格式
作用：统一全部分镜画面参数，方便后续批量合成

18.5 变量聚合

输入：单条画面素材数据
输出：单条画面结构化变量包
功能：打包画面、时长、序号、文本绑定信息
作用：单条分镜完整数据封装，便于批量汇总

18.6 video_error

输入：画面生成失败标记
输出：异常报错标识
功能：捕获图像生成接口报错、空图异常
作用：识别素材生成失败案例，进入兜底分支

18.7 选择器

输入：正常画面素材 / 异常标记
输出：正常画面流 / 兜底占位视频流
功能：二分流容错判断
作用：图片生成失败时自动切换兜底素材，视频不会黑屏断流

18.8 error_mp4

输入：异常标记
输出：预设兜底占位视频片段
功能：加载备用默认素材
作用：容错兜底，保证任意分镜生成失败，视频仍能正常渲染导出

18.9 sub_video_generate

输入：单条画面片段、对应配音时间戳
输出：单分镜画面时间轴
功能：绑定画面显示时长与配音时间轴对齐
作用：实现台词播放时同步展示对应配图

18.10 变量聚合

输入：全部循环单分镜数据
输出：完整分镜画面素材数组
功能：汇总循环内所有画面片段，输出全局画面列表
作用：循环结束后一次性输出全部正文画面，送入剪辑合成节点

19. 提取关键词

输入：完整全文文案
输出：高权重核心关键词数组
功能：大模型提取文案主题、核心名词、情绪词
作用：供给封面绘图、分镜提示词，保证画面贴合视频核心主题
输入提示词
此处内容已隐藏，请评论后刷新页面查看.

输出

20. 片头生成

输入：封面图、标题音效、标题 BGM、标题文字
输出：完整片头片段视频
功能：整合封面、标题文字、片头音轨，合成独立片头素材
作用：统一输出片头成品片段，直接并入正片开头，简化图层叠加逻辑
【代码】

此处内容已隐藏，请评论后刷新页面查看.

封面图独立管线

21. 大模型

输入：全文关键词、视频标题
输出：封面专属精细化绘图 Prompt
功能：关键词组合生成封面风格、构图、配色指令
作用：精准控制封面画面，突出视频核心主题，提升点击率
输入提示词

此处内容已隐藏，请评论后刷新页面查看.

输出

22. 封面图片画板

输入：封面绘图 Prompt
输出：横版封面图片素材
功能：文生图生成短视频封面底图
作用：自动生成视频封面，无需外部作图工具

23. 封面图片横屏时间线 media

输入：封面图、片头总时长
输出：封面图画面时间轴
功能：给静态封面图绑定显示起止时间
作用：让封面图作为片头画面插入视频时序，适配剪辑轨道

24. add_text 字幕批量聚合

输入：字幕时间轴数组
输出：正文滚动字幕图层
功能：批量渲染同步字幕，按时间戳自动弹出消失
作用：人声同步字幕，提升视频可读性

25. add_audio 添加背景音乐

输入：全局 BGM 音频
输出：背景音乐底层音轨
功能：叠加持续背景音乐，自动降低音量避免盖过人声
作用：全程背景配乐，填充音频空白

26. add_loud 添加打字音效

输入：正文打字音效素材、视频总时间轴
输出：打字音效音轨
功能：全程循环叠加打字背景音效
作用：增加打字氛围感，填充静音间隙

27. title_generate 标题轨道

输入：片头标题文字、片头时长
输出：片头大标题文字图层
功能：生成片头主标题文字动画
作用：开篇展示视频标题，吸引观看

28. add_audio 添加配音

输入：主口播配音时间轴音频
输出：人声配音音轨
功能：叠加人声朗读音频，对齐画面时间轴
作用：视频核心人声轨道，中层音频基础

视频多层轨道合成节点（按图层底层→上层顺序）

29. add_video 正文视频

输入：全部分镜画面时间轴数组
输出：底层主视频画面轨道
功能：拼接所有分镜画面，生成视频底层画面流
作用：视频最底层载体，所有字幕、音频、特效都叠加在该图层之上

30. add_effect 添加字幕

输入：正文字幕图层
输出：带动画特效的正文字幕轨道
功能：给字幕添加淡入、滑动动画效果
作用：美化字幕展示，避免文字生硬弹出

31. add_caption 添加字幕

输入：标题文字图层
输出：标题专属字幕轨道
功能：独立管控标题字幕样式、动画，和正文字幕区分
作用：标题视觉层级高于正文字幕，强化开篇标题

32. add_audio 添加音效

输入：额外环境音效素材
输出：辅助音效音轨
功能：叠加额外风声、提示音等小众音效
作用：丰富音频层次，按需添加特色音效

33. add_text 添加水印

输入：水印文字、透明度、位置参数
输出：全局水印顶层文字图层
功能：固定位置渲染半透明水印，覆盖全片时长
作用：视频版权标识，防止素材盗用

34. 添加水印关键帧

输入：封面图片素材、首尾时间参数
输出：封面图层
功能：在视频开头、结尾叠加封面静态图
作用：统一视频首尾封面，适配平台封面展示规则

35. 添加封面关键帧

收尾导出节点

结束

输入：完整剪辑工程数据
输出：成片视频 URL、视频时长、素材日志、报错记录
功能：触发视频云端渲染，输出成品文件并返回结果
作用：工作流终点，交付最终可发布短视频，同步返回素材运行日志便于排错

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

扣子工作流

喜欢就支持一下吧

相关推荐

评论抢沙发

请登录后发表评论

暂无评论内容