Omi 是一款革命性的开源 AI 可穿戴设备开发框架,支持屏幕捕捉、对话监听、实时转录、摘要生成和智能行动建议。它采用模块化设计理念,支持桌面端、手机端及多种可穿戴硬件形态,让开发者能快速构建真正属于自己的个性化 AI 助手,GitHub 星标高达 9.1k。

🎤 引言

你有没有遇到过这种情况:开会时拼命记笔记,结果还是漏掉了重要行动项?或者学习时想记录讲解内容,手写速度完全跟不上?

现在有一款叫 Omi 的开源 AI 设备,它能「看到」你在看什么、「听到」你在说什么,然后自动帮你整理成摘要,甚至直接给出行动建议。

9.1k 星标——开发者社区已经用脚投票了。


⭐ 核心功能

屏幕捕捉与理解(Screen Capture)

  • 实时读取屏幕内容,AI 分析你在做什么
  • 比如你正在看一封邮件,它能理解上下文并给出回复建议
  • 支持多显示器,工作状态全覆盖

对话监听与实时转录(Conversation Transcription)

  • 开会时自动把每个人的发言转成文字
  • 多人对话也能分离识别
  • 离线模式下依然能转录,不用担心网络问题

智能摘要生成(Summarization)

  • 自动提炼对话要点,再也不用手动整理会议纪要
  • 提取任务清单,直接转成行动项
  • 支持生成不同格式:Markdown、表格、清单

AI 行动建议(Action Items)

  • 根据对话内容,AI 直接告诉你「接下来应该做什么」
  • 任务到期提醒
  • 支持连接到外部工具自动执行(比如创建日历事件)

模块化硬件设计

  • 六边形智能项链:主打轻便日常佩戴
  • AR 眼镜形态:解放双手的下一代交互
  • 手表集成:运动+AI 助手二合一
  • 完全开源,开发者可自由定制外观和功能

📥 安装与使用

硬件准备

方式一:购买官方硬件

方式二:DIY 组装

  • 项目提供完整硬件设计文档
  • 社区有现成的 PCB 和外壳方案

开发环境搭建

# 1. 克隆项目
git clone https://github.com/BasedHardware/omi.git
cd omi

# 2. 查看项目结构
ls -la

# 3. 构建桌面端应用
cd desktop
npm install
npm run dev

# 4. 移动端构建
cd ../app
npm install
npm run start

连接可穿戴设备

  1. 打开桌面端/移动端应用
  2. 配对蓝牙设备
  3. 开始使用

🎯 适用场景

会议达人必备
比如你每天要开 3-4 个会,会后还要整理纪要。Omi 能在会议结束时直接给你一份结构化的会议纪要和待办清单,省去 30 分钟的整理时间。

学习党救星
看在线课程、听播客、参加研讨会时,Omi 实时转录并生成摘要。复习时直接看笔记,不用边听边写。

隐私优先用户
相比 Ai Pin、Rabbit R1 这些云端处理数据的设备,Omi 可以完全本地运行,你的数据只有你能看到。


🔍 对比/替代方案

设备价格开源本地处理定制化
Omi硬件自选极高
Friend AI$99
Rabbit R1$199
Ai Pin$699

最大的区别在于开源本地处理。你花 $99 买的 Friend 本质上还是个订阅制的云服务,一旦公司倒闭,设备就成砖头。Omi 不一样——代码在你手里,设备永远能用。


⚠️ 注意事项

  1. 隐私法律风险:设备会持续监听对话,欧美有些地区对录音有严格法律限制,使用前先了解当地法规
  2. 硬件门槛:虽然代码开源,但组装硬件需要一定 DIY 能力。不想折腾可以直接买成品
  3. 续航是痛点:可穿戴设备普遍续航一般,重度使用可能需要一天一充
  4. 生态刚起步:相比 Apple、Google 的生态,第三方配件和社区资源还在快速增长期

✅ 总结

Omi 代表了 AI 可穿戴设备的一种新范式——开源 + 模块化 + 本地优先。它不是一款成品,更像是一个开发框架,适合动手能力强的技术爱好者。

如果你想拥有完全掌控自己数据的 AI 助手、讨厌被闭源硬件绑架、喜欢折腾新技术,Omi 值得研究。

适合人群:开发者、技术爱好者、隐私强迫症患者、DIY 发烧友

推荐指数:⭐⭐⭐⭐(4/5)