Audiblez 是一款开源电子书转有声书工具,基于 Kokoro-82M TTS 模型,支持将 EPUB 一键转换为 m4b 格式有声书。支持多国语言、多种语音,GPU 加速下 5 分钟即可完成一本小说,开源免费。

🎤 引言

有没有遇到过这种情况:手头有一些 EPUB 电子书,想在路上听却找不到合适的有声书版本?或者觉得市面上的有声书订阅太贵,想自己动手做?

我之前也试过各种 TTS 工具,要么声音太机械,要么配置复杂。直到发现了 Audiblez —— 基于 Kokoro-82M TTS 模型,声音自然,一条命令就能搞定整本书。


⭐ 核心亮点

1. Kokoro-82M 语音合成引擎

Audiblez 底层用的是 Kokoro-82M,这是个只有 82M 参数但效果出色的 TTS 模型。训练数据不到 100 小时,输出质量不错。Apache 协议开源,可商用。

2. 多语言多语音支持

目前支持美式英语、英式英语、西班牙语、法语、印地语、意大利语、日语、巴西葡萄牙语、中文普通话等多种语言。

中文有多种语音可选,男女声都有。

3. GPU 加速,5 分钟一本书

在 Google Colab 的 T4 GPU 上,转换一本约 16 万字的小说只需要 5 分钟,速度约 600 字符/秒。M2 Mac CPU 上大概 1 小时,60 字符/秒。

4. 输出标准 m4b 格式

直接生成 iTunes/Audible 兼容的 m4b 文件,带章节标记,主流有声书播放器都能识别。


📥 安装与使用

安装依赖

# Ubuntu/Debian
sudo apt install ffmpeg espeak-ng
pip install audiblez

# macOS
brew install ffmpeg espeak-ng
pip install audiblez

# Windows(推荐用虚拟环境)
mkdir audiblez && cd audiblez
python -m venv venv
.\venv\Scripts\Activate.ps1
pip install audiblez pillow wxpython

基础用法

# 转换整本书
audiblez book.epub -v af_sky

# 指定语速(0.5-2.0)
audiblez book.epub -v af_sky -s 1.5

# 使用 GPU 加速
audiblez book.epub -v af_sky --cuda

# 交互式选择章节
audiblez book.epub -v af_sky --pick

GUI 界面

pip install audiblez pillow wxpython
audiblez-ui

🛠 适用场景

适合谁用:

  • 想把自己收藏的电子书转成有声书
  • 对现有有声书平台内容不满意
  • 需要多语言语音合成的开发者
  • 不想花钱订阅 Audible 的用户

不太适合:

  • 追求真人演播情感表达的(TTS 毕竟还是机器声)
  • 需要实时语音合成的(这是离线批量工具)
  • Apple Silicon 用户暂时没优化(等 MLX 版本)

🔍 与同类工具对比

工具语音质量语言支持开源价格特点
Audiblez优秀多语言免费Kokoro 模型,声音自然
Edge TTS良好多语言免费依赖微软服务
Coqui TTS良好较多免费可训练自定义声音
ElevenLabs优秀多语言付费质量高但贵
Google TTS一般多语言付费API 调用收费

Audiblez 的优势在于完全本地运行,不依赖云服务,隐私性好,Kokoro 的声音质量不输付费服务。


✅ 总结

Audiblez 是近期用过比较顺手的 TTS 工具。配置简单、声音自然、速度够快,完全免费开源。如果你有电子书想转成有声书,可以试试。

项目地址:github.com/santinic/audiblez

PyPI 安装:pip install audiblez

作者还写了详细的技术博客,可以去 claudio.uk 看看实现细节。