Audiblez 是一款开源电子书转有声书工具,基于 Kokoro-82M TTS 模型,支持将 EPUB 一键转换为 m4b 格式有声书。支持多国语言、多种语音,GPU 加速下 5 分钟即可完成一本小说,开源免费。
🎤 引言
有没有遇到过这种情况:手头有一些 EPUB 电子书,想在路上听却找不到合适的有声书版本?或者觉得市面上的有声书订阅太贵,想自己动手做?
我之前也试过各种 TTS 工具,要么声音太机械,要么配置复杂。直到发现了 Audiblez —— 基于 Kokoro-82M TTS 模型,声音自然,一条命令就能搞定整本书。
⭐ 核心亮点
1. Kokoro-82M 语音合成引擎
Audiblez 底层用的是 Kokoro-82M,这是个只有 82M 参数但效果出色的 TTS 模型。训练数据不到 100 小时,输出质量不错。Apache 协议开源,可商用。
2. 多语言多语音支持
目前支持美式英语、英式英语、西班牙语、法语、印地语、意大利语、日语、巴西葡萄牙语、中文普通话等多种语言。
中文有多种语音可选,男女声都有。
3. GPU 加速,5 分钟一本书
在 Google Colab 的 T4 GPU 上,转换一本约 16 万字的小说只需要 5 分钟,速度约 600 字符/秒。M2 Mac CPU 上大概 1 小时,60 字符/秒。
4. 输出标准 m4b 格式
直接生成 iTunes/Audible 兼容的 m4b 文件,带章节标记,主流有声书播放器都能识别。
📥 安装与使用
安装依赖
# Ubuntu/Debian
sudo apt install ffmpeg espeak-ng
pip install audiblez
# macOS
brew install ffmpeg espeak-ng
pip install audiblez
# Windows(推荐用虚拟环境)
mkdir audiblez && cd audiblez
python -m venv venv
.\venv\Scripts\Activate.ps1
pip install audiblez pillow wxpython基础用法
# 转换整本书
audiblez book.epub -v af_sky
# 指定语速(0.5-2.0)
audiblez book.epub -v af_sky -s 1.5
# 使用 GPU 加速
audiblez book.epub -v af_sky --cuda
# 交互式选择章节
audiblez book.epub -v af_sky --pickGUI 界面
pip install audiblez pillow wxpython
audiblez-ui🛠 适用场景
适合谁用:
- 想把自己收藏的电子书转成有声书
- 对现有有声书平台内容不满意
- 需要多语言语音合成的开发者
- 不想花钱订阅 Audible 的用户
不太适合:
- 追求真人演播情感表达的(TTS 毕竟还是机器声)
- 需要实时语音合成的(这是离线批量工具)
- Apple Silicon 用户暂时没优化(等 MLX 版本)
🔍 与同类工具对比
| 工具 | 语音质量 | 语言支持 | 开源 | 价格 | 特点 |
|---|---|---|---|---|---|
| Audiblez | 优秀 | 多语言 | 是 | 免费 | Kokoro 模型,声音自然 |
| Edge TTS | 良好 | 多语言 | 是 | 免费 | 依赖微软服务 |
| Coqui TTS | 良好 | 较多 | 是 | 免费 | 可训练自定义声音 |
| ElevenLabs | 优秀 | 多语言 | 否 | 付费 | 质量高但贵 |
| Google TTS | 一般 | 多语言 | 否 | 付费 | API 调用收费 |
Audiblez 的优势在于完全本地运行,不依赖云服务,隐私性好,Kokoro 的声音质量不输付费服务。
✅ 总结
Audiblez 是近期用过比较顺手的 TTS 工具。配置简单、声音自然、速度够快,完全免费开源。如果你有电子书想转成有声书,可以试试。
项目地址:github.com/santinic/audiblez
PyPI 安装:pip install audiblez
作者还写了详细的技术博客,可以去 claudio.uk 看看实现细节。