薅社会主义羊毛请继续往下阅读
前置文案处理区
0. 开始
- 输入:外部触发参数(账号、原文案、素材配置、音量 / 分辨率参数)
- 输出:全局通用变量流
- 功能:工作流启动入口,接收用户外部传入全部配置数据
- 作用:统一分发参数给下游所有节点,是整条流程的数据源头

1. 文案文件文本提取 convert_file
- 输入:上传文档文件(txt/csv)
- 输出:纯文本字符串
wenan_text - 功能:解析文档,剔除格式符号、换行冗余,提取干净文案
- 作用:支持文件批量导入文案,无需手动复制文字,适配长文案批量生成

2. 用户文案变量聚合
- 输入:文件提取文案、手动输入文案
- 输出:合并后完整文案变量
wenan - 功能:双来源文案合并,去空值、去重复
- 作用:兼容「传文件」「手动打字」两种输入方式,统一下游文案数据源
- 【代码】

3. 是否输入自己的文案(分支判断)
- 输入:总文案
wenan - 输出:两条并行分支数据流
- 功能:条件分流判断
分支 1:无现成口播稿 → 走 AI 生成口播;
分支 2:自带口播文案 → 直接分割分句
- 作用:兼容两种业务场景,不用两套独立工作流,降低维护成本

4. AI 生成口播稿
- 输入:正文长文案
- 输出:口语化分段口播脚本
- 功能:大模型润色,书面文转适合配音的口语短句,自动拆分短句
- 作用:解决纯文章生硬、不适合配音的问题,自动适配短视频朗读节奏
- 【提示词】
5. 口播稿智能分割 text_split
- 输入:#4 输出的 AI 生成口播完整文稿
- 输出:标准化分句文本数组 segments
- 功能:按标点、朗读时长阈值切割短句,统一分句长度
- 作用:将 AI 生成的完整口播稿拆分成单句,和 #6 原生口播分割输出格式统一,方便 #7 聚合

6. 口播智能分割 text_splitter
- 输入:现成口播文案
- 输出:分句文本数组
segments - 功能:按标点、时长阈值自动切割短句,控制单句配音时长
- 作用:统一分句粒度,保证后续 TTS、画面分镜一一对应,音画同步

7. 正文文案聚合
- 输入:AI 生成口播分段、原生分割口播分段
- 输出:统一标准分段数组
segments - 功能:合并两条分支的分句数据,标准化数组格式
- 作用:两条分流链路数据归一,下游 TTS、绘图节点只需要对接一套数据

8. 正文语音合成
- 输入:分段文本数组
- 输出:分段音频文件、单句时长、音频 URL 数组
- 功能:批量 TTS 语音合成,统一音色、语速、音量
- 作用:一次性生成全部口播配音,绑定每一句对应时长,为字幕、画面对齐提供时间基准

9. 提取正文 URL 为列表 audio
- 输入:TTS 合成原始音频数据
- 输出:结构化音频列表(音频地址、时长、序号)
- 功能:清洗 TTS 返回杂乱数据,规整成可遍历数组
- 作用:给时间轴、音频叠加节点提供标准化音频素材

10. 提取正文音频时间轴 audio
- 输入:结构化音频列表
- 输出:完整配音时间轴
timelines(起始时间、结束时间、对应文本) - 功能:根据单句时长自动拼接全局时间线
- 作用:全流程音画同步核心基准,字幕、画面、音效全部基于该时间轴对齐

音频素材并行轨道(音效、BGM)
11. 键盘打字音效
- 输入:全局时长参数
- 输出:打字音效音频文件、时长数据
- 功能:生成通用打字背景音效素材
- 作用:正文画面叠加打字氛围感音效,提升视频观感

12. title 键盘打字音效
- 输入:片头标题时长
- 输出:标题专属打字音效
- 功能:独立生成片头打字音效,音量、节奏单独可调
- 作用:区分片头与正文音效,片头氛围感单独控制

13. 上传背景音乐 BGM
- 输入:BGM 素材文件、音量阈值
- 输出:全局背景音乐音频流
- 功能:加载通用背景音乐,自动裁剪匹配视频总时长
- 作用:全片底层背景音乐轨道,统一音量防盖过人声

14. title 背景音乐
- 输入:片头时长、标题 BGM 素材
- 输出:片头独立 BGM 音频
- 功能:片头专属背景音乐,与正文 BGM 分离控制
- 作用:片头使用差异化配乐,强化开篇记忆点

字幕、绘图提示词生成
15. 文案合并时间轴 wenan_ti
- 输入:分段文本、配音时间轴
- 输出:绑定文字 + 时间戳的完整字幕数组
- 功能:文本与起止时间一一绑定,生成标准字幕时间线
- 作用:批量字幕渲染节点直接读取,自动同步配音弹出字幕

16. 生成分镜提示词
- 输入:单句口播文本、文案关键词
- 输出:每一句对应的 AI 绘图提示词数组
- 功能:AI 根据台词生成匹配画面的文生图 Prompt
- 作用:实现一句台词对应一张配图,自动匹配文案内容,无需手动写绘图词
- 输入
- 【提示词】

- 输出

17. 生成配图 / 视频提示词
- 输入:全文总文案、核心关键词
- 输出:封面、片头通用绘图 Prompt
- 功能:生成封面大图、片头背景图专用提示词
- 作用:独立管控封面视觉风格,和正文分镜画面区分开
- 输入
- 【提示词】

批量分镜图像批处理体(18 系列循环子节点)
18.1 图像生成
- 输入:单句分镜绘图提示词
- 输出:单句配图图片
- 功能:循环批量文生图,逐句生成台词对应画面
- 作用:自动化批量生成视频全部正文画面,一句一图

18.2 选择器
- 输入:生成图片结果
- 输出:正常图片 / 空值标记
- 功能:判断图片是否生成成功,分流异常数据
- 作用:图像生成失败时自动分流,防止流程中断报错

18.3 bsd_border_mp4
- 输入:原始生成图片
- 输出:带边框、简易转场的短画面片段
- 功能:给静态图片加边框、淡入淡出转场,转成短视频片段
- 作用:静态图片动态化,避免画面生硬静止

18.4 主生成
- 输入:带边框画面片段、单句配音时长
- 输出:标准化画面素材(画面文件、时长、序号)
- 功能:统一画面尺寸、时长参数,规整素材格式
- 作用:统一全部分镜画面参数,方便后续批量合成

18.5 变量聚合
- 输入:单条画面素材数据
- 输出:单条画面结构化变量包
- 功能:打包画面、时长、序号、文本绑定信息
- 作用:单条分镜完整数据封装,便于批量汇总

18.6 video_error
- 输入:画面生成失败标记
- 输出:异常报错标识
- 功能:捕获图像生成接口报错、空图异常
- 作用:识别素材生成失败案例,进入兜底分支

18.7 选择器
- 输入:正常画面素材 / 异常标记
- 输出:正常画面流 / 兜底占位视频流
- 功能:二分流容错判断
- 作用:图片生成失败时自动切换兜底素材,视频不会黑屏断流

18.8 error_mp4
- 输入:异常标记
- 输出:预设兜底占位视频片段
- 功能:加载备用默认素材
- 作用:容错兜底,保证任意分镜生成失败,视频仍能正常渲染导出

18.9 sub_video_generate
- 输入:单条画面片段、对应配音时间戳
- 输出:单分镜画面时间轴
- 功能:绑定画面显示时长与配音时间轴对齐
- 作用:实现台词播放时同步展示对应配图

18.10 变量聚合
- 输入:全部循环单分镜数据
- 输出:完整分镜画面素材数组
- 功能:汇总循环内所有画面片段,输出全局画面列表
- 作用:循环结束后一次性输出全部正文画面,送入剪辑合成节点

19. 提取关键词
- 输入:完整全文文案
- 输出:高权重核心关键词数组
- 功能:大模型提取文案主题、核心名词、情绪词
- 作用:供给封面绘图、分镜提示词,保证画面贴合视频核心主题
- 输入提示词

- 输出

20. 片头生成
- 输入:封面图、标题音效、标题 BGM、标题文字
- 输出:完整片头片段视频
- 功能:整合封面、标题文字、片头音轨,合成独立片头素材
- 作用:统一输出片头成品片段,直接并入正片开头,简化图层叠加逻辑
- 【代码】

封面图独立管线
21. 大模型
- 输入:全文关键词、视频标题
- 输出:封面专属精细化绘图 Prompt
- 功能:关键词组合生成封面风格、构图、配色指令
- 作用:精准控制封面画面,突出视频核心主题,提升点击率
- 输入提示词

- 输出

22. 封面图片画板
- 输入:封面绘图 Prompt
- 输出:横版封面图片素材
- 功能:文生图生成短视频封面底图
- 作用:自动生成视频封面,无需外部作图工具

23. 封面图片横屏时间线 media
- 输入:封面图、片头总时长
- 输出:封面图画面时间轴
- 功能:给静态封面图绑定显示起止时间
- 作用:让封面图作为片头画面插入视频时序,适配剪辑轨道

24. add_text 字幕批量聚合
- 输入:字幕时间轴数组
- 输出:正文滚动字幕图层
- 功能:批量渲染同步字幕,按时间戳自动弹出消失
- 作用:人声同步字幕,提升视频可读性

25. add_audio 添加背景音乐
- 输入:全局 BGM 音频
- 输出:背景音乐底层音轨
- 功能:叠加持续背景音乐,自动降低音量避免盖过人声
- 作用:全程背景配乐,填充音频空白

26. add_loud 添加打字音效
- 输入:正文打字音效素材、视频总时间轴
- 输出:打字音效音轨
- 功能:全程循环叠加打字背景音效
- 作用:增加打字氛围感,填充静音间隙

27. title_generate 标题轨道
- 输入:片头标题文字、片头时长
- 输出:片头大标题文字图层
- 功能:生成片头主标题文字动画
- 作用:开篇展示视频标题,吸引观看

28. add_audio 添加配音
- 输入:主口播配音时间轴音频
- 输出:人声配音音轨
- 功能:叠加人声朗读音频,对齐画面时间轴
- 作用:视频核心人声轨道,中层音频基础

视频多层轨道合成节点(按图层底层→上层顺序)
29. add_video 正文视频
- 输入:全部分镜画面时间轴数组
- 输出:底层主视频画面轨道
- 功能:拼接所有分镜画面,生成视频底层画面流
- 作用:视频最底层载体,所有字幕、音频、特效都叠加在该图层之上

30. add_effect 添加字幕
- 输入:正文字幕图层
- 输出:带动画特效的正文字幕轨道
- 功能:给字幕添加淡入、滑动动画效果
- 作用:美化字幕展示,避免文字生硬弹出

31. add_caption 添加字幕
- 输入:标题文字图层
- 输出:标题专属字幕轨道
- 功能:独立管控标题字幕样式、动画,和正文字幕区分
- 作用:标题视觉层级高于正文字幕,强化开篇标题


32. add_audio 添加音效
- 输入:额外环境音效素材
- 输出:辅助音效音轨
- 功能:叠加额外风声、提示音等小众音效
- 作用:丰富音频层次,按需添加特色音效

33. add_text 添加水印
- 输入:水印文字、透明度、位置参数
- 输出:全局水印顶层文字图层
- 功能:固定位置渲染半透明水印,覆盖全片时长
- 作用:视频版权标识,防止素材盗用


34. 添加水印关键帧
- 输入:封面图片素材、首尾时间参数
- 输出:封面图层
- 功能:在视频开头、结尾叠加封面静态图
- 作用:统一视频首尾封面,适配平台封面展示规则

35. 添加封面关键帧

收尾导出节点
结束
- 输入:完整剪辑工程数据
- 输出:成片视频 URL、视频时长、素材日志、报错记录
- 功能:触发视频云端渲染,输出成品文件并返回结果
- 作用:工作流终点,交付最终可发布短视频,同步返回素材运行日志便于排错

© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END











暂无评论内容