FireRed-OpenStoryline 是一款 AI 视频创作助手,通过自然语言对话将繁琐的视频剪辑变成简单的指令操作。内置 LLM 智能规划、素材自动搜索匹配、脚本自动生成、BGM/旁白 AI 推荐,支持把工作流保存为可复用技能,实现批量创作。Windows/Mac/Linux 多平台支持。
🎤 引言
视频剪辑这事,懂的都懂 —— 找素材、拼镜头、写旁白、配音乐、调转场……一套流程下来,半天没了。
有没有想过:跟 AI 聊聊天就能出片?
FireRed-OpenStoryline 就是干这个的。它是一个 AI 视频创作 Agent,你告诉它想要什么风格的视频,它帮你规划脚本、搜刮素材、自动剪辑、生成旁白配乐,全程自然语言控制,不用碰一根 PR 时间线。
2026 年 2 月刚开源,口碑已经在 GitHub 上传开了。
⭐ 核心功能
🗣️ 自然语言驱动的视频剪辑
这是最核心的交互方式。你不需要记住任何快捷键,也不需要拉片对点。直接说「把第二段和第四段换个顺序,再把开头那段配音换成更有感染力的语气」,AI 听懂,执行,出结果。
实际使用时,Web 界面会实时显示编辑预览窗口、脚本编辑面板和素材库三栏布局,每个操作都有即时反馈。所有编辑操作(剪切、替换、调整顺序、修改脚本、调色换字体……)全部通过自然语言完成,不用翻菜单。
🔍 智能素材搜索与匹配
给 AI 一段主题描述,它自动去网上搜刮匹配的图片和视频片段,还会做内容分割和理解。不需要你手动去 Pixabay、Pexels 一个个搜。
✍️ 智能脚本生成
结合你给的主题、视觉内容理解和情感识别,自动构建故事线和上下文相关的旁白文案。还内置了 Few-shot 风格迁移能力 —— 喂一段参考文本(比如「产品评测风」「日常 vlog 风」),AI 自动复刻语气、节奏和句式结构。
🎵 AI 推荐 BGM / 旁白 / 字体
根据视频内容和情感基调自动推荐配乐,支持节拍智能对齐。说一句「要克制感」「要纪录片风格」,系统匹配对应音轨、人声旁白和字体,确保调性统一。
🛠️ 可复用技能(Style Skills)
这是我觉得最有意思的功能。把一整套编辑工作流保存为自定义 Skill,下次换一批素材,应用同一个 Skill,直接复制风格,实现批量创作。比如你调好了一个「小红书种草风」模板,换商品图片跑一遍就行,不用每次重新调参数。
🎬 AI 转场生成(2026-04 新增)
根据上一段结尾帧、下一段开头帧,加上自然语言描述,AI 自动生成过渡镜头。场景切换更顺滑,叙事更连贯。
⚡ ASR 粗剪(2026-03 新增)
针对口播视频,自动删除语气词、重复句、停顿点,按时间戳分段剪辑。口播内容剪辑效率直接拉满。官方测试数据显示,处理 10 分钟口播视频只需约 15 秒完成粗剪。
📥 安装使用
推荐配置要求
- Python >= 3.11
- CUDA(推荐,GPU 加速渲染)
- FFmpeg(必须)
- Conda 环境(Miniforge 推荐)
快速安装
# 克隆仓库
git clone https://github.com/FireRedTeam/FireRed-OpenStoryline.git
cd FireRed-OpenStoryline
# 创建 Conda 环境
conda create -n storyline python=3.11
conda activate storyline
# 构建环境(自动装 PyTorch 等依赖)
sh build_env.sh
# 下载资源(字体/音乐/模型)
chmod +x download.sh
./download.sh
# 安装项目依赖
pip install -r requirements.txt下载模型和资源
手动下载也很简单:
- models.zip → 解压到
.storyline目录 - resource.zip → 解压到
resource目录
配置 API-Key
首次使用前需要配置 LLM 的 API-Key,支持 OpenAI、Claude 等多种模型,具体看 API-Key 配置文档。
启动服务
# 方式一:命令行界面
python cli.py
# 方式二:Web 界面
uvicorn agent_fastapi:app --host 127.0.0.1 --port 8005
# 访问 http://127.0.0.1:8005Docker 部署
# 海外用户
docker pull openstoryline/openstoryline:v1.0.1
# 国内用户(阿里云加速)
docker pull crpi-6knxem4w8ggpdnsn.cn-shanghai.personal.cr.aliyuncs.com/openstoryline/openstoryline:v1.0.1
docker run \
-v $(pwd)/config.toml:/app/config.toml \
-v $(pwd)/outputs:/app/outputs \
-v $(pwd)/run.sh:/app/run.sh \
-p 7860:7860 \
openstoryline/openstoryline:v1.0.1启动后访问 http://0.0.0.0:7860 打开 Web 界面。
OpenClaw 集成
OpenStoryline 官方内置了两个 OpenClaw Skills:openstoryline-install 和 openstoryline-use,覆盖安装到实际使用全流程。在 OpenClaw 里直接说「帮我安装 OpenStoryline」,Skills 会自动下载运行。
🎯 适用场景
📱 内容创作者 / 自媒体
小红书、抖音、B站 口播视频创作者。ASR 粗剪 + AI 脚本生成 + BGM 推荐,一套流程把原来半天的活压缩到几十分钟。
🎬 企业宣传 / 产品视频
用 Style Skills 保存一版品牌调性模板,换产品图,换文案,一键批量生成多个产品视频。保持风格统一,效率翻倍。
📚 教育 / 培训视频
纪录片风格 / 知识科普风格,配上 AI 生成的旁白和自动匹配的背景音乐,一个人能肝出一个课程系列。
🛒 电商带货
产品展示视频、口播评测视频,批量产出不用每次手动调。
🔍 对比同类工具
| 特性 | OpenStoryline | 传统剪辑工具 | 其他 AI 剪辑工具 |
|---|---|---|---|
| 操作方式 | 自然语言对话 | 手动拖拽时间线 | 模板化操作 |
| 脚本生成 | AI 自动生成 | 手动撰写 | 模板填充 |
| 素材搜索 | AI 自动搜索匹配 | 手动搜索下载 | 仅本地素材 |
| 批量创作 | Style Skills 复用 | 手动重复操作 | 需付费订阅 |
| 学习成本 | 低(对话式) | 高(快捷键/面板) | 中(模板操作) |
| 开源免费 | ✅ | ❌(Adobe/Premiere 付费) | ❌(大多数订阅制) |
对比下来,传统工具像 Adobe Premiere 适合专业精细控制,但学习曲线陡、价格高。其他 AI 剪辑工具大多是订阅制 SaaS,数据在云端,隐私和成本都是问题。OpenStoryline 的优势在于开源免费 + 本地部署 + 自然语言交互 + 可复用工作流,对个人创作者和中小企业来说性价比很高。
⚠️ 注意事项
AI 转场依赖第三方 AIGC 服务,生成成本相对较高,且结果受素材质量、提示词和模型表现影响,存在一定不确定性。建议仅在真正需要时开启,不要默认打开。
素材质量问题:README 里放的是高度压缩的 Demo 视频,实际输出默认保留原始分辨率,支持自定义尺寸。实际效果比 Demo 展示的会更精细。
字体 / 音乐许可:开源版本内置的字体和音乐属于基础效果,商用推荐按官方教程解锁商业级素材库,视觉效果会明显提升。
首次安装配置稍复杂:需要科学上网下载模型、资源包较大、API-Key 配置有门槛。建议参照官方文档一步步来,环境配置是最大的坑。
✅ 总结
总体来说,OpenStoryline 解决的是视频创作中「操作门槛高、重复劳动多」这两个痛点。自然语言驱动剪辑 + 可复用技能这两个设计思路很聪明,让 AI 不是替代你做创意决策,而是替你干那些脏活累活。
适合谁:
- 有批量视频生产需求的内容创作者 / 电商卖家
- 想用 AI 提效、不想学复杂剪辑工具的人
- 有一定技术动手能力、愿意折腾开源工具的用户
不适合谁:
- 需要电影级精细控制的 professional 剪辑师
- 完全不懂技术的小白(首次安装有门槛)
一句话推荐:
把它想象成一个「视频剪辑版 ChatGPT」—— 你说什么,它剪什么,还能把剪辑风格存成模板下次复用。
GitHub:FireRed-OpenStoryline