ViNote是一款开源免费的AI视频知识提取工具,支持B站、YouTube等多平台视频处理,可一键生成结构化笔记、知识卡片和交互式思维导图。内置ViNoter超级智能体,基于ANP协议实现对话式视频搜索与处理,适用于Windows、macOS、Linux系统。

🎤 引言

面对海量视频内容,手动整理笔记耗时且低效。B站、YouTube上充斥着海量的教程、讲座、分享,但看完就忘、收藏吃灰是大多数人的常态。

ViNote(视记AI)就是为解决这些问题而生的。它是一款开源的AI视频知识提取工具,核心理念是"Video + Note"——让每个视频都能转化为你的知识资产。

最新版引入了基于ANP(Agent Network Protocol)协议的超级视记智能体ViNoter,标志着从被动工具到主动智能伙伴的升级。你只需要像聊天一样说出需求,它就能自动完成跨平台视频搜索、转录、笔记生成全流程。


⭐ 核心亮点

1. 对话式操作 → 零学习成本

不需要记住复杂的操作流程,像和朋友聊天一样说出你的需求:

  • "帮我在B站搜索Python教程"
  • "选第一个,帮我转录并生成笔记"
  • "把笔记翻译成英文"

ViNoter智能体自动理解意图,串联搜索→转录→笔记→翻译全流程。

2. 跨平台支持 → 一处搞定所有视频

  • 在线视频:YouTube、Bilibili等主流平台
  • 本地视频:MP4、AVI、MOV、MKV等格式
  • 自动识别:粘贴链接或本地路径,系统自动判断

3. Video to Everything → 多形态知识输出

不只是简单的文字转录,ViNote能生成多种形式的知识资产:

  • 结构化笔记:Markdown格式,完美兼容Obsidian、Notion
  • 知识卡片:概念卡、要点卡、对比卡,适合快速复习
  • 思维导图:基于Markmap的交互式导图,可缩放折叠
  • 智能问答:基于视频内容的AI问答,深度理解上下文

4. 高质量转录 → 本地Whisper引擎

基于Faster-Whisper的本地音频转录,支持多语言自动检测:

  • 模型大小可选:tiny到large-v3,平衡速度与质量
  • 字幕优先策略:优先提取平台AI字幕,大幅提升处理速度
  • 多语言翻译:支持11种语言的摘要和翻译

5. 知识管理 → 分类标签双管齐下

  • 17个预置分类:开箱即用的笔记分类体系
  • AI自动打标签:智能提取关键词,灵活组织知识
  • SQLite存储:数据可靠,告别JSON文件丢失风险
  • 交叉筛选:按分类、标签、关键词多维度快速检索

6. 基于ANP协议 → 去中心化Agent协作

ANP(Agent Network Protocol)是全球领先的开源去中心化Agent协作标准。ViNoter基于此协议,未来可与其他Agent服务互联互通,实现更强大的协作能力。


📥 安装与使用

ViNote提供多种安装方式,从一键Docker到手动部署:

Docker一键部署(推荐)

# 1. 克隆项目
git clone https://github.com/zrt-ai-lab/ViNote.git
cd ViNote

# 2. 配置环境变量
cp .env.example .env
# 编辑.env,填入OPENAI_API_KEY等配置

# 3. 构建并启动
docker compose up -d

# 4. 访问应用
open http://localhost:8999

手动安装

# 1. 克隆项目
git clone https://github.com/zrt-ai-lab/ViNote.git
cd ViNote

# 2. 安装uv包管理器
curl -LsSf https://astral.sh/uv/install.sh | sh

# 3. 安装FFmpeg
# macOS: brew install ffmpeg
# Ubuntu: sudo apt-get install ffmpeg

# 4. 安装依赖
uv sync

# 5. 配置环境
cp .env.example .env
# 编辑.env填入API密钥

# 6. 启动服务
./start.sh

环境要求

  • Python 3.10+
  • FFmpeg(音视频处理)
  • OpenAI API Key(或其他兼容接口)

使用ViNoter超级智能体

  1. 打开应用首页,选择"ViNoter超级智搜"标签
  2. 在对话框中输入需求,例如:

    • "帮我在B站搜索Python教程"
    • "选第一个,帮我转录并生成笔记"
    • "把笔记翻译成英文"

使用视频笔记功能

  1. 选择"视频笔记"标签
  2. 粘贴视频链接或本地文件路径
  3. 点击"预览"查看视频信息
  4. 选择摘要语言,点击"生成笔记"
  5. 等待处理完成,下载Markdown文件

🛠 适用场景

适合谁用?

  • 学习者:将视频课程转化为结构化笔记,提高复习效率
  • 知识工作者:从会议录像、讲座视频中提取关键信息
  • 内容创作者:快速了解竞品视频,生成内容灵感
  • 研究人员:批量处理学术报告、会议视频,建立知识库

不太适合?

  • 追求极致转录质量:本地Whisper虽强,但专业场景可能需要人工校对
  • 无OpenAI API访问:核心功能依赖大模型,需要API密钥
  • 处理超长视频:显存和内存有限,超长视频可能需分段处理

技术架构亮点

ViNote的技术实现有几个值得关注的工程细节:

  • ANP协议集成:基于Agent Network Protocol实现去中心化Agent协作
  • 本地Whisper引擎:使用Faster-Whisper进行本地音频转录,保护隐私
  • SQLite数据存储:相比JSON文件,提供更可靠的数据持久化
  • SSE实时推送:处理进度通过Server-Sent Events实时推送到前端
  • 字幕优先策略:优先提取平台AI字幕,减少API调用成本

🔍 与同类工具对比

特性ViNoteYouTube SummaryBibiGPTNotion AI
开源免费✅ 完全开源❌ 付费✅ 开源❌ 付费
本地部署✅ 支持❌ 云端✅ 支持❌ 云端
多平台支持✅ B站+YouTube❌ 仅YouTube✅ B站+YouTube❌ 通用
智能体交互✅ ViNoter对话式❌ 无❌ 无❌ 无
知识卡片✅ 自动生成❌ 无❌ 无❌ 无
思维导图✅ 自动生成❌ 无❌ 无❌ 无
智能问答✅ 基于视频内容❌ 无❌ 无❌ 通用
ANP协议✅ 支持❌ 无❌ 无❌ 无

ViNote的核心优势在于全流程自动化多形态输出,它不是简单的视频转文字,而是一套完整的视频知识提取与管理系统。


✅ 总结

ViNote代表了视频学习工具的进化方向:从"被动观看"走向"主动提取",从"零散收藏"走向"系统管理"。

它的开源属性意味着你可以完全掌控自己的数据,本地部署保证了隐私安全,而ViNoter智能体的对话式交互则大大降低了使用门槛。

对于经常通过视频学习的人来说,ViNote是一个值得尝试的效率工具。尤其是当你面对大量视频资料需要整理、复习时,它能帮你节省大量时间。

当然,它也有局限性:依赖OpenAI API意味着有一定的使用成本,转录质量虽然不错但还不能完全替代人工。但对于大多数场景,它已经足够好用了。

项目地址:https://github.com/zrt-ai-lab/ViNote


Stars: 关注增长中(2026-03-17)