Whisper 基于 OpenAI语音识别模型轻松将语音转换成文本

前言

Whisper 桌面程序基于 OpenAI 的 Whisper 自动语音识别模型。Whisper 是一个在大量不同音频数据集上训练的通用语音识别模型，也是一个执行多语言语音翻译和语言识别的多任务模型。通过 Whisper 桌面程序，我们可以轻松地将不同语言的音频转换成文本文件。

1、Whisper 桌面程序是免费开源的，你可以到 github下载程序安装包。

1、进入音频模型下载页面，根据页面提示的显存大小选择适合您电脑的模型数据包。

2、进入下载页面后，选择相应的数据包进行下载。

1.解压 Whisper 桌面程序安装包，然后将下载的模型数据包复制到解压后的文件夹或其他位置。

2.运行 WhisperDesktop.exe 程序。第一次运行时，需要对程序进行简单设置，选择刚刚下载的模型，模式选择 GPU。

3、进入操作界面后，选择语言，要提取的音频文件和输出文件类型和位置等，点击transcribe开始提取。

提取后的文字非常准确，我测试过一首歌提取出的文字没有一个错字，还是相当不错的。有兴趣的朋友可以安装使用，感受一下和其它同类软件有什么不一样的体验。