Omi 是一款革命性的开源 AI 可穿戴设备开发框架,支持屏幕捕捉、对话监听、实时转录、摘要生成和智能行动建议。它采用模块化设计理念,支持桌面端、手机端及多种可穿戴硬件形态,让开发者能快速构建真正属于自己的个性化 AI 助手,GitHub 星标高达 9.1k。
🎤 引言
你有没有遇到过这种情况:开会时拼命记笔记,结果还是漏掉了重要行动项?或者学习时想记录讲解内容,手写速度完全跟不上?
现在有一款叫 Omi 的开源 AI 设备,它能「看到」你在看什么、「听到」你在说什么,然后自动帮你整理成摘要,甚至直接给出行动建议。
9.1k 星标——开发者社区已经用脚投票了。
⭐ 核心功能
屏幕捕捉与理解(Screen Capture)
- 实时读取屏幕内容,AI 分析你在做什么
- 比如你正在看一封邮件,它能理解上下文并给出回复建议
- 支持多显示器,工作状态全覆盖
对话监听与实时转录(Conversation Transcription)
- 开会时自动把每个人的发言转成文字
- 多人对话也能分离识别
- 离线模式下依然能转录,不用担心网络问题
智能摘要生成(Summarization)
- 自动提炼对话要点,再也不用手动整理会议纪要
- 提取任务清单,直接转成行动项
- 支持生成不同格式:Markdown、表格、清单
AI 行动建议(Action Items)
- 根据对话内容,AI 直接告诉你「接下来应该做什么」
- 任务到期提醒
- 支持连接到外部工具自动执行(比如创建日历事件)
模块化硬件设计
- 六边形智能项链:主打轻便日常佩戴
- AR 眼镜形态:解放双手的下一代交互
- 手表集成:运动+AI 助手二合一
- 完全开源,开发者可自由定制外观和功能
📥 安装与使用
硬件准备
方式一:购买官方硬件
方式二:DIY 组装
- 项目提供完整硬件设计文档
- 社区有现成的 PCB 和外壳方案
开发环境搭建
# 1. 克隆项目
git clone https://github.com/BasedHardware/omi.git
cd omi
# 2. 查看项目结构
ls -la
# 3. 构建桌面端应用
cd desktop
npm install
npm run dev
# 4. 移动端构建
cd ../app
npm install
npm run start连接可穿戴设备
- 打开桌面端/移动端应用
- 配对蓝牙设备
- 开始使用
🎯 适用场景
会议达人必备
比如你每天要开 3-4 个会,会后还要整理纪要。Omi 能在会议结束时直接给你一份结构化的会议纪要和待办清单,省去 30 分钟的整理时间。
学习党救星
看在线课程、听播客、参加研讨会时,Omi 实时转录并生成摘要。复习时直接看笔记,不用边听边写。
隐私优先用户
相比 Ai Pin、Rabbit R1 这些云端处理数据的设备,Omi 可以完全本地运行,你的数据只有你能看到。
🔍 对比/替代方案
| 设备 | 价格 | 开源 | 本地处理 | 定制化 |
|---|---|---|---|---|
| Omi | 硬件自选 | ✅ | ✅ | 极高 |
| Friend AI | $99 | ❌ | ❌ | ❌ |
| Rabbit R1 | $199 | ❌ | ❌ | ❌ |
| Ai Pin | $699 | ❌ | ❌ | ❌ |
最大的区别在于开源和本地处理。你花 $99 买的 Friend 本质上还是个订阅制的云服务,一旦公司倒闭,设备就成砖头。Omi 不一样——代码在你手里,设备永远能用。
⚠️ 注意事项
- 隐私法律风险:设备会持续监听对话,欧美有些地区对录音有严格法律限制,使用前先了解当地法规
- 硬件门槛:虽然代码开源,但组装硬件需要一定 DIY 能力。不想折腾可以直接买成品
- 续航是痛点:可穿戴设备普遍续航一般,重度使用可能需要一天一充
- 生态刚起步:相比 Apple、Google 的生态,第三方配件和社区资源还在快速增长期
✅ 总结
Omi 代表了 AI 可穿戴设备的一种新范式——开源 + 模块化 + 本地优先。它不是一款成品,更像是一个开发框架,适合动手能力强的技术爱好者。
如果你想拥有完全掌控自己数据的 AI 助手、讨厌被闭源硬件绑架、喜欢折腾新技术,Omi 值得研究。
适合人群:开发者、技术爱好者、隐私强迫症患者、DIY 发烧友
推荐指数:⭐⭐⭐⭐(4/5)