FireRed-OpenStoryline 是一款 AI 视频创作助手,通过自然语言对话将繁琐的视频剪辑变成简单的指令操作。内置 LLM 智能规划、素材自动搜索匹配、脚本自动生成、BGM/旁白 AI 推荐,支持把工作流保存为可复用技能,实现批量创作。Windows/Mac/Linux 多平台支持。

🎤 引言

视频剪辑这事,懂的都懂 —— 找素材、拼镜头、写旁白、配音乐、调转场……一套流程下来,半天没了。

有没有想过:跟 AI 聊聊天就能出片?

FireRed-OpenStoryline 就是干这个的。它是一个 AI 视频创作 Agent,你告诉它想要什么风格的视频,它帮你规划脚本、搜刮素材、自动剪辑、生成旁白配乐,全程自然语言控制,不用碰一根 PR 时间线。

2026 年 2 月刚开源,口碑已经在 GitHub 上传开了。


⭐ 核心功能

🗣️ 自然语言驱动的视频剪辑

这是最核心的交互方式。你不需要记住任何快捷键,也不需要拉片对点。直接说「把第二段和第四段换个顺序,再把开头那段配音换成更有感染力的语气」,AI 听懂,执行,出结果。

实际使用时,Web 界面会实时显示编辑预览窗口、脚本编辑面板和素材库三栏布局,每个操作都有即时反馈。所有编辑操作(剪切、替换、调整顺序、修改脚本、调色换字体……)全部通过自然语言完成,不用翻菜单。

🔍 智能素材搜索与匹配

给 AI 一段主题描述,它自动去网上搜刮匹配的图片和视频片段,还会做内容分割和理解。不需要你手动去 Pixabay、Pexels 一个个搜。

✍️ 智能脚本生成

结合你给的主题、视觉内容理解和情感识别,自动构建故事线和上下文相关的旁白文案。还内置了 Few-shot 风格迁移能力 —— 喂一段参考文本(比如「产品评测风」「日常 vlog 风」),AI 自动复刻语气、节奏和句式结构。

🎵 AI 推荐 BGM / 旁白 / 字体

根据视频内容和情感基调自动推荐配乐,支持节拍智能对齐。说一句「要克制感」「要纪录片风格」,系统匹配对应音轨、人声旁白和字体,确保调性统一。

🛠️ 可复用技能(Style Skills)

这是我觉得最有意思的功能。把一整套编辑工作流保存为自定义 Skill,下次换一批素材,应用同一个 Skill,直接复制风格,实现批量创作。比如你调好了一个「小红书种草风」模板,换商品图片跑一遍就行,不用每次重新调参数。

🎬 AI 转场生成(2026-04 新增)

根据上一段结尾帧、下一段开头帧,加上自然语言描述,AI 自动生成过渡镜头。场景切换更顺滑,叙事更连贯。

⚡ ASR 粗剪(2026-03 新增)

针对口播视频,自动删除语气词、重复句、停顿点,按时间戳分段剪辑。口播内容剪辑效率直接拉满。官方测试数据显示,处理 10 分钟口播视频只需约 15 秒完成粗剪。


📥 安装使用

推荐配置要求

  • Python >= 3.11
  • CUDA(推荐,GPU 加速渲染)
  • FFmpeg(必须)
  • Conda 环境(Miniforge 推荐)

快速安装

# 克隆仓库
git clone https://github.com/FireRedTeam/FireRed-OpenStoryline.git
cd FireRed-OpenStoryline

# 创建 Conda 环境
conda create -n storyline python=3.11
conda activate storyline

# 构建环境(自动装 PyTorch 等依赖)
sh build_env.sh

# 下载资源(字体/音乐/模型)
chmod +x download.sh
./download.sh

# 安装项目依赖
pip install -r requirements.txt

下载模型和资源

手动下载也很简单:

配置 API-Key

首次使用前需要配置 LLM 的 API-Key,支持 OpenAI、Claude 等多种模型,具体看 API-Key 配置文档

启动服务

# 方式一:命令行界面
python cli.py

# 方式二:Web 界面
uvicorn agent_fastapi:app --host 127.0.0.1 --port 8005
# 访问 http://127.0.0.1:8005

Docker 部署

# 海外用户
docker pull openstoryline/openstoryline:v1.0.1

# 国内用户(阿里云加速)
docker pull crpi-6knxem4w8ggpdnsn.cn-shanghai.personal.cr.aliyuncs.com/openstoryline/openstoryline:v1.0.1

docker run \
  -v $(pwd)/config.toml:/app/config.toml \
  -v $(pwd)/outputs:/app/outputs \
  -v $(pwd)/run.sh:/app/run.sh \
  -p 7860:7860 \
  openstoryline/openstoryline:v1.0.1

启动后访问 http://0.0.0.0:7860 打开 Web 界面。

OpenClaw 集成

OpenStoryline 官方内置了两个 OpenClaw Skills:openstoryline-installopenstoryline-use,覆盖安装到实际使用全流程。在 OpenClaw 里直接说「帮我安装 OpenStoryline」,Skills 会自动下载运行。


🎯 适用场景

📱 内容创作者 / 自媒体

小红书、抖音、B站 口播视频创作者。ASR 粗剪 + AI 脚本生成 + BGM 推荐,一套流程把原来半天的活压缩到几十分钟。

🎬 企业宣传 / 产品视频

用 Style Skills 保存一版品牌调性模板,换产品图,换文案,一键批量生成多个产品视频。保持风格统一,效率翻倍。

📚 教育 / 培训视频

纪录片风格 / 知识科普风格,配上 AI 生成的旁白和自动匹配的背景音乐,一个人能肝出一个课程系列。

🛒 电商带货

产品展示视频、口播评测视频,批量产出不用每次手动调。


🔍 对比同类工具

特性OpenStoryline传统剪辑工具其他 AI 剪辑工具
操作方式自然语言对话手动拖拽时间线模板化操作
脚本生成AI 自动生成手动撰写模板填充
素材搜索AI 自动搜索匹配手动搜索下载仅本地素材
批量创作Style Skills 复用手动重复操作需付费订阅
学习成本低(对话式)高(快捷键/面板)中(模板操作)
开源免费❌(Adobe/Premiere 付费)❌(大多数订阅制)

对比下来,传统工具像 Adobe Premiere 适合专业精细控制,但学习曲线陡、价格高。其他 AI 剪辑工具大多是订阅制 SaaS,数据在云端,隐私和成本都是问题。OpenStoryline 的优势在于开源免费 + 本地部署 + 自然语言交互 + 可复用工作流,对个人创作者和中小企业来说性价比很高。


⚠️ 注意事项

AI 转场依赖第三方 AIGC 服务,生成成本相对较高,且结果受素材质量、提示词和模型表现影响,存在一定不确定性。建议仅在真正需要时开启,不要默认打开。

素材质量问题:README 里放的是高度压缩的 Demo 视频,实际输出默认保留原始分辨率,支持自定义尺寸。实际效果比 Demo 展示的会更精细。

字体 / 音乐许可:开源版本内置的字体和音乐属于基础效果,商用推荐按官方教程解锁商业级素材库,视觉效果会明显提升。

首次安装配置稍复杂:需要科学上网下载模型、资源包较大、API-Key 配置有门槛。建议参照官方文档一步步来,环境配置是最大的坑。


✅ 总结

总体来说,OpenStoryline 解决的是视频创作中「操作门槛高、重复劳动多」这两个痛点。自然语言驱动剪辑 + 可复用技能这两个设计思路很聪明,让 AI 不是替代你做创意决策,而是替你干那些脏活累活。

适合谁

  • 有批量视频生产需求的内容创作者 / 电商卖家
  • 想用 AI 提效、不想学复杂剪辑工具的人
  • 有一定技术动手能力、愿意折腾开源工具的用户

不适合谁

  • 需要电影级精细控制的 professional 剪辑师
  • 完全不懂技术的小白(首次安装有门槛)

一句话推荐

把它想象成一个「视频剪辑版 ChatGPT」—— 你说什么,它剪什么,还能把剪辑风格存成模板下次复用。

GitHub:FireRed-OpenStoryline