TypeWhisper 是 macOS 本地语音转文字工具,支持 WhisperKit、Parakeet 等 8 种引擎,完全离线运行保护隐私。内置 LLM 文本处理、快捷短语、字幕导出,HTTP API 和 CLI 让自动化更简单,免费开源,文末附详细使用教程

🎤 引言

打字打到手指发麻?开会记笔记手速跟不上?试试 TypeWhisper 吧——一款专门为 macOS 打造的本地语音转文字工具,数据全程在本地处理,不用担心隐私泄露。


⭐ 核心功能

8 种转录引擎任你选

TypeWhisper 内置了相当豪华的引擎阵容:

  • WhisperKit:支持 99+ 语言,流式输出,还能翻译
  • Parakeet TDT v3:25 种欧洲语言,速度极快
  • Apple SpeechAnalyzer:macOS 15+ 内置,无需下载模型
  • Qwen3 ASR:阿里通义模型,MLX 本地运行
  • Voxtral:本地运行的小型模型
  • Groq Whisper / OpenAI Whisper:云端 API 方案
  • OpenAI Compatible:兼容任意 OpenAI 接口的 API

本地运行的好处大家都懂——隐私有保障,而且不用给 OpenAI 交钱。内存不够的选手也有得选:8GB 以下用 Whisper Tiny,8-16GB 用 Small 或者 Voxtral,16GB+ 直接上 Large v3。

流式预览 + 自动粘贴

说话的时候就能看到实时转录结果(WhisperKit 支持),录完自动粘贴到当前 App,效率拉满。配合全局快捷键,整个系统随时待命。

LLM 文本处理

转完的文字还能直接丢给 LLM 处理,内置 8 种预设:翻译、正式化、摘要、语法修正、写邮件、列清单、简化、解释。Apple Intelligence(macOS 26+)、Groq、OpenAI、Gemini 都支持。

智能配置文件

可以为不同 App 或网站配置专属方案——比如 Mail 用德语,Slack 用英语,Terminal 自动提交。URL 模式匹配还支持子域名,GitHub 写代码和写文档可以分别用不同配置,够细。

其他实用功能

  • 字幕导出:SRT、WebVTT 带时间戳
  • 快捷短语:占位符支持 {{DATE}}、{{TIME}}、{{CLIPBOARD}}
  • 查词历史:可搜索、可编辑、可批量导出
  • 插件系统:内置 Linear(语音创建议题)、Webhook 等插件
  • HTTP API + CLI:开发者友好的自动化接口

📥 安装与使用

安装方式

# Homebrew 一键安装
brew install --cask typewhisper/tap/typewhisper

或者直接去 GitHub Releases 下载 DMG。

快速上手

  1. 安装完成后打开 TypeWhisper,菜单栏会出现图标
  2. 进入 Settings,授予麦克风和辅助功能权限
  3. 选择一个引擎,需要本地模型的下载对应模型
  4. 设置全局快捷键,开始使用

HTTP API(进阶玩法)

# 启用:Settings > Advanced > API Server(默认端口 8978)

# 查看状态
curl http://localhost:8978/v1/status

# 转录文件
curl -X POST http://localhost:8978/v1/transcribe \
  -F "[email protected]" \
  -F "language=zh"

# 查看历史
curl "http://localhost:8978/v1/history?q=meeting&limit=10"

CLI 工具

# 安装:Settings > Advanced > CLI Tool > Install

typewhisper status           # 查看状态
typewhisper models           # 列出可用模型
typewhisper transcribe file.wav --language zh --json

🎯 适用场景

开发者:代码评审用语音输入代替部分键盘操作,配合 Terminal 配置文件自动提交

写作者:会议记录、播客字幕、文档起草,语音输出后 LLM 快速整理

隐私敏感用户:医疗、法律、商务对话记录,不想让数据经过第三方服务器

多语言用户:支持 99+ 语言,开会不用来回切换输入法


⚠️ 注意事项

  • 内存要求:8GB 以下建议 Whisper Tiny/Turbo,16GB+ 才能流畅跑大模型
  • macOS 版本:最低 14.0(Sonoma),部分功能需要 15+ 或 26+
  • 网络需求:本地模型完全离线;Groq/OpenAI API 需要网络连接
  • Apple Intelligence:仅限 macOS 26+ 用户
  • 社区反馈:有用户提到设置逻辑略复杂,首次配置需要花点时间熟悉

✅ 总结

TypeWhisper 是个相当能打的本地语音输入工具——8 种引擎覆盖了从快速到精准的各种需求,隐私优先的设计对于敏感场景非常友好。HTTP API 和 CLI 工具让它不只是一个 GUI 软件,自动化玩家也能玩出花。

要说缺点,内存要求对老 Mac 用户不太友好,另外配置逻辑确实有点门槛。但看在免费开源的份上,这些都不算大问题。

推荐指数:⭐⭐⭐⭐(4/5)

项目评分
功能完整度⭐⭐⭐⭐⭐
隐私保护⭐⭐⭐⭐⭐
易用性⭐⭐⭐
性能表现⭐⭐⭐⭐

适合人群:macOS 隐私党、开发者、多语言办公用户

不适合:老旧 Mac 用户(内存 < 8GB)、追求一键傻瓜式体验的用户


Stars: 263 (2026-03-31) | License: GPLv3 | GitHub