ViNote是一款开源免费的AI视频知识提取工具,支持B站、YouTube等多平台视频处理,可一键生成结构化笔记、知识卡片和交互式思维导图。内置ViNoter超级智能体,基于ANP协议实现对话式视频搜索与处理,适用于Windows、macOS、Linux系统。
🎤 引言
面对海量视频内容,手动整理笔记耗时且低效。B站、YouTube上充斥着海量的教程、讲座、分享,但看完就忘、收藏吃灰是大多数人的常态。
ViNote(视记AI)就是为解决这些问题而生的。它是一款开源的AI视频知识提取工具,核心理念是"Video + Note"——让每个视频都能转化为你的知识资产。
最新版引入了基于ANP(Agent Network Protocol)协议的超级视记智能体ViNoter,标志着从被动工具到主动智能伙伴的升级。你只需要像聊天一样说出需求,它就能自动完成跨平台视频搜索、转录、笔记生成全流程。
⭐ 核心亮点
1. 对话式操作 → 零学习成本
不需要记住复杂的操作流程,像和朋友聊天一样说出你的需求:
- "帮我在B站搜索Python教程"
- "选第一个,帮我转录并生成笔记"
- "把笔记翻译成英文"
ViNoter智能体自动理解意图,串联搜索→转录→笔记→翻译全流程。
2. 跨平台支持 → 一处搞定所有视频
- 在线视频:YouTube、Bilibili等主流平台
- 本地视频:MP4、AVI、MOV、MKV等格式
- 自动识别:粘贴链接或本地路径,系统自动判断
3. Video to Everything → 多形态知识输出
不只是简单的文字转录,ViNote能生成多种形式的知识资产:
- 结构化笔记:Markdown格式,完美兼容Obsidian、Notion
- 知识卡片:概念卡、要点卡、对比卡,适合快速复习
- 思维导图:基于Markmap的交互式导图,可缩放折叠
- 智能问答:基于视频内容的AI问答,深度理解上下文
4. 高质量转录 → 本地Whisper引擎
基于Faster-Whisper的本地音频转录,支持多语言自动检测:
- 模型大小可选:tiny到large-v3,平衡速度与质量
- 字幕优先策略:优先提取平台AI字幕,大幅提升处理速度
- 多语言翻译:支持11种语言的摘要和翻译
5. 知识管理 → 分类标签双管齐下
- 17个预置分类:开箱即用的笔记分类体系
- AI自动打标签:智能提取关键词,灵活组织知识
- SQLite存储:数据可靠,告别JSON文件丢失风险
- 交叉筛选:按分类、标签、关键词多维度快速检索
6. 基于ANP协议 → 去中心化Agent协作
ANP(Agent Network Protocol)是全球领先的开源去中心化Agent协作标准。ViNoter基于此协议,未来可与其他Agent服务互联互通,实现更强大的协作能力。
📥 安装与使用
ViNote提供多种安装方式,从一键Docker到手动部署:
Docker一键部署(推荐)
# 1. 克隆项目
git clone https://github.com/zrt-ai-lab/ViNote.git
cd ViNote
# 2. 配置环境变量
cp .env.example .env
# 编辑.env,填入OPENAI_API_KEY等配置
# 3. 构建并启动
docker compose up -d
# 4. 访问应用
open http://localhost:8999手动安装
# 1. 克隆项目
git clone https://github.com/zrt-ai-lab/ViNote.git
cd ViNote
# 2. 安装uv包管理器
curl -LsSf https://astral.sh/uv/install.sh | sh
# 3. 安装FFmpeg
# macOS: brew install ffmpeg
# Ubuntu: sudo apt-get install ffmpeg
# 4. 安装依赖
uv sync
# 5. 配置环境
cp .env.example .env
# 编辑.env填入API密钥
# 6. 启动服务
./start.sh环境要求
- Python 3.10+
- FFmpeg(音视频处理)
- OpenAI API Key(或其他兼容接口)
使用ViNoter超级智能体
- 打开应用首页,选择"ViNoter超级智搜"标签
在对话框中输入需求,例如:
- "帮我在B站搜索Python教程"
- "选第一个,帮我转录并生成笔记"
- "把笔记翻译成英文"
使用视频笔记功能
- 选择"视频笔记"标签
- 粘贴视频链接或本地文件路径
- 点击"预览"查看视频信息
- 选择摘要语言,点击"生成笔记"
- 等待处理完成,下载Markdown文件
🛠 适用场景
适合谁用?
- 学习者:将视频课程转化为结构化笔记,提高复习效率
- 知识工作者:从会议录像、讲座视频中提取关键信息
- 内容创作者:快速了解竞品视频,生成内容灵感
- 研究人员:批量处理学术报告、会议视频,建立知识库
不太适合?
- 追求极致转录质量:本地Whisper虽强,但专业场景可能需要人工校对
- 无OpenAI API访问:核心功能依赖大模型,需要API密钥
- 处理超长视频:显存和内存有限,超长视频可能需分段处理
技术架构亮点
ViNote的技术实现有几个值得关注的工程细节:
- ANP协议集成:基于Agent Network Protocol实现去中心化Agent协作
- 本地Whisper引擎:使用Faster-Whisper进行本地音频转录,保护隐私
- SQLite数据存储:相比JSON文件,提供更可靠的数据持久化
- SSE实时推送:处理进度通过Server-Sent Events实时推送到前端
- 字幕优先策略:优先提取平台AI字幕,减少API调用成本
🔍 与同类工具对比
| 特性 | ViNote | YouTube Summary | BibiGPT | Notion AI |
|---|---|---|---|---|
| 开源免费 | ✅ 完全开源 | ❌ 付费 | ✅ 开源 | ❌ 付费 |
| 本地部署 | ✅ 支持 | ❌ 云端 | ✅ 支持 | ❌ 云端 |
| 多平台支持 | ✅ B站+YouTube | ❌ 仅YouTube | ✅ B站+YouTube | ❌ 通用 |
| 智能体交互 | ✅ ViNoter对话式 | ❌ 无 | ❌ 无 | ❌ 无 |
| 知识卡片 | ✅ 自动生成 | ❌ 无 | ❌ 无 | ❌ 无 |
| 思维导图 | ✅ 自动生成 | ❌ 无 | ❌ 无 | ❌ 无 |
| 智能问答 | ✅ 基于视频内容 | ❌ 无 | ❌ 无 | ❌ 通用 |
| ANP协议 | ✅ 支持 | ❌ 无 | ❌ 无 | ❌ 无 |
ViNote的核心优势在于全流程自动化和多形态输出,它不是简单的视频转文字,而是一套完整的视频知识提取与管理系统。
✅ 总结
ViNote代表了视频学习工具的进化方向:从"被动观看"走向"主动提取",从"零散收藏"走向"系统管理"。
它的开源属性意味着你可以完全掌控自己的数据,本地部署保证了隐私安全,而ViNoter智能体的对话式交互则大大降低了使用门槛。
对于经常通过视频学习的人来说,ViNote是一个值得尝试的效率工具。尤其是当你面对大量视频资料需要整理、复习时,它能帮你节省大量时间。
当然,它也有局限性:依赖OpenAI API意味着有一定的使用成本,转录质量虽然不错但还不能完全替代人工。但对于大多数场景,它已经足够好用了。
项目地址:https://github.com/zrt-ai-lab/ViNote
Stars: 关注增长中(2026-03-17)