🎬 FireRed-OpenStoryline：AI视频创作助手通过自然语言对话实现智能化视频剪辑

FireRed-OpenStoryline 是一款 AI 视频创作助手，通过自然语言对话将繁琐的视频剪辑变成简单的指令操作。内置 LLM 智能规划、素材自动搜索匹配、脚本自动生成、BGM/旁白 AI 推荐，支持把工作流保存为可复用技能，实现批量创作。Windows/Mac/Linux 多平台支持。

🎤 引言

视频剪辑这事，懂的都懂 —— 找素材、拼镜头、写旁白、配音乐、调转场……一套流程下来，半天没了。

有没有想过：跟 AI 聊聊天就能出片？

FireRed-OpenStoryline 就是干这个的。它是一个 AI 视频创作 Agent，你告诉它想要什么风格的视频，它帮你规划脚本、搜刮素材、自动剪辑、生成旁白配乐，全程自然语言控制，不用碰一根 PR 时间线。

2026 年 2 月刚开源，口碑已经在 GitHub 上传开了。

⭐ 核心功能

🗣️ 自然语言驱动的视频剪辑

这是最核心的交互方式。你不需要记住任何快捷键，也不需要拉片对点。直接说「把第二段和第四段换个顺序，再把开头那段配音换成更有感染力的语气」，AI 听懂，执行，出结果。

实际使用时，Web 界面会实时显示编辑预览窗口、脚本编辑面板和素材库三栏布局，每个操作都有即时反馈。所有编辑操作（剪切、替换、调整顺序、修改脚本、调色换字体……）全部通过自然语言完成，不用翻菜单。

🔍 智能素材搜索与匹配

给 AI 一段主题描述，它自动去网上搜刮匹配的图片和视频片段，还会做内容分割和理解。不需要你手动去 Pixabay、Pexels 一个个搜。

✍️ 智能脚本生成

结合你给的主题、视觉内容理解和情感识别，自动构建故事线和上下文相关的旁白文案。还内置了 Few-shot 风格迁移能力 —— 喂一段参考文本（比如「产品评测风」「日常 vlog 风」），AI 自动复刻语气、节奏和句式结构。

🎵 AI 推荐 BGM / 旁白 / 字体

根据视频内容和情感基调自动推荐配乐，支持节拍智能对齐。说一句「要克制感」「要纪录片风格」，系统匹配对应音轨、人声旁白和字体，确保调性统一。

🛠️ 可复用技能（Style Skills）

这是我觉得最有意思的功能。把一整套编辑工作流保存为自定义 Skill，下次换一批素材，应用同一个 Skill，直接复制风格，实现批量创作。比如你调好了一个「小红书种草风」模板，换商品图片跑一遍就行，不用每次重新调参数。

🎬 AI 转场生成（2026-04 新增）

根据上一段结尾帧、下一段开头帧，加上自然语言描述，AI 自动生成过渡镜头。场景切换更顺滑，叙事更连贯。

⚡ ASR 粗剪（2026-03 新增）

针对口播视频，自动删除语气词、重复句、停顿点，按时间戳分段剪辑。口播内容剪辑效率直接拉满。官方测试数据显示，处理 10 分钟口播视频只需约 15 秒完成粗剪。

📥 安装使用

推荐配置要求

Python >= 3.11
CUDA（推荐，GPU 加速渲染）
FFmpeg（必须）
Conda 环境（Miniforge 推荐）

快速安装

# 克隆仓库
git clone https://github.com/FireRedTeam/FireRed-OpenStoryline.git
cd FireRed-OpenStoryline

# 创建 Conda 环境
conda create -n storyline python=3.11
conda activate storyline

# 构建环境（自动装 PyTorch 等依赖）
sh build_env.sh

# 下载资源（字体/音乐/模型）
chmod +x download.sh
./download.sh

# 安装项目依赖
pip install -r requirements.txt

下载模型和资源

手动下载也很简单：

models.zip → 解压到 .storyline 目录
resource.zip → 解压到 resource 目录

配置 API-Key

首次使用前需要配置 LLM 的 API-Key，支持 OpenAI、Claude 等多种模型，具体看 API-Key 配置文档。

启动服务

# 方式一：命令行界面
python cli.py

# 方式二：Web 界面
uvicorn agent_fastapi:app --host 127.0.0.1 --port 8005
# 访问 http://127.0.0.1:8005

Docker 部署

# 海外用户
docker pull openstoryline/openstoryline:v1.0.1

# 国内用户（阿里云加速）
docker pull crpi-6knxem4w8ggpdnsn.cn-shanghai.personal.cr.aliyuncs.com/openstoryline/openstoryline:v1.0.1

docker run \
  -v $(pwd)/config.toml:/app/config.toml \
  -v $(pwd)/outputs:/app/outputs \
  -v $(pwd)/run.sh:/app/run.sh \
  -p 7860:7860 \
  openstoryline/openstoryline:v1.0.1

启动后访问 http://0.0.0.0:7860 打开 Web 界面。

OpenClaw 集成

OpenStoryline 官方内置了两个 OpenClaw Skills：openstoryline-install 和 openstoryline-use，覆盖安装到实际使用全流程。在 OpenClaw 里直接说「帮我安装 OpenStoryline」，Skills 会自动下载运行。

🎯 适用场景

📱 内容创作者 / 自媒体

小红书、抖音、B站口播视频创作者。ASR 粗剪 + AI 脚本生成 + BGM 推荐，一套流程把原来半天的活压缩到几十分钟。

🎬 企业宣传 / 产品视频

用 Style Skills 保存一版品牌调性模板，换产品图，换文案，一键批量生成多个产品视频。保持风格统一，效率翻倍。

📚 教育 / 培训视频

纪录片风格 / 知识科普风格，配上 AI 生成的旁白和自动匹配的背景音乐，一个人能肝出一个课程系列。

🛒 电商带货

产品展示视频、口播评测视频，批量产出不用每次手动调。

🔍 对比同类工具

特性	OpenStoryline	传统剪辑工具	其他 AI 剪辑工具
操作方式	自然语言对话	手动拖拽时间线	模板化操作
脚本生成	AI 自动生成	手动撰写	模板填充
素材搜索	AI 自动搜索匹配	手动搜索下载	仅本地素材
批量创作	Style Skills 复用	手动重复操作	需付费订阅
学习成本	低（对话式）	高（快捷键/面板）	中（模板操作）
开源免费	✅	❌（Adobe/Premiere 付费）	❌（大多数订阅制）

对比下来，传统工具像 Adobe Premiere 适合专业精细控制，但学习曲线陡、价格高。其他 AI 剪辑工具大多是订阅制 SaaS，数据在云端，隐私和成本都是问题。OpenStoryline 的优势在于开源免费 + 本地部署 + 自然语言交互 + 可复用工作流，对个人创作者和中小企业来说性价比很高。

⚠️ 注意事项

AI 转场依赖第三方 AIGC 服务，生成成本相对较高，且结果受素材质量、提示词和模型表现影响，存在一定不确定性。建议仅在真正需要时开启，不要默认打开。

素材质量问题：README 里放的是高度压缩的 Demo 视频，实际输出默认保留原始分辨率，支持自定义尺寸。实际效果比 Demo 展示的会更精细。

字体 / 音乐许可：开源版本内置的字体和音乐属于基础效果，商用推荐按官方教程解锁商业级素材库，视觉效果会明显提升。

首次安装配置稍复杂：需要科学上网下载模型、资源包较大、API-Key 配置有门槛。建议参照官方文档一步步来，环境配置是最大的坑。

✅ 总结

总体来说，OpenStoryline 解决的是视频创作中「操作门槛高、重复劳动多」这两个痛点。自然语言驱动剪辑 + 可复用技能这两个设计思路很聪明，让 AI 不是替代你做创意决策，而是替你干那些脏活累活。

适合谁：

有批量视频生产需求的内容创作者 / 电商卖家
想用 AI 提效、不想学复杂剪辑工具的人
有一定技术动手能力、愿意折腾开源工具的用户

不适合谁：

需要电影级精细控制的 professional 剪辑师
完全不懂技术的小白（首次安装有门槛）

一句话推荐：

把它想象成一个「视频剪辑版 ChatGPT」—— 你说什么，它剪什么，还能把剪辑风格存成模板下次复用。

GitHub：FireRed-OpenStoryline