前言

Whisper 桌面程序基于 OpenAI 的 Whisper 自动语音识别模型。Whisper 是一个在大量不同音频数据集上训练的通用语音识别模型,也是一个执行多语言语音翻译和语言识别的多任务模型。通过 Whisper 桌面程序,我们可以轻松地将不同语言的音频转换成文本文件。


一、Whisper 桌面程序下载

1、Whisper 桌面程序是免费开源的,你可以到 github下载程序安装包

2023-08-09_195826.jpg


二、音频模型下载

1、进入音频模型下载页面,根据页面提示的显存大小选择适合您电脑的模型数据包。

2023-08-09_200724.jpg


2、进入下载页面后,选择相应的数据包进行下载。

2023-08-09_201301.jpg


三、使用方法

1.解压 Whisper 桌面程序安装包,然后将下载的模型数据包复制到解压后的文件夹或其他位置。

2023-08-09_201922.jpg


2.运行 WhisperDesktop.exe 程序。第一次运行时,需要对程序进行简单设置,选择刚刚下载的模型,模式选择 GPU。

whisper.gif


3、进入操作界面后,选择语言,要提取的音频文件和输出文件类型和位置等,点击transcribe开始提取。

whisper1.gif


提取后的文字非常准确,我测试过一首歌提取出的文字没有一个错字,还是相当不错的。有兴趣的朋友可以安装使用,感受一下和其它同类软件有什么不一样的体验。