一、前言

Video-subtitle-extractor (vse)-视频字幕提取器,可以将视频硬字幕提取生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。


二、主要特性

  • 提取视频中的关键帧

  • 检测视频帧中文本的所在位置
  • 识别视频帧中文本的内容

  • 过滤非字幕区域的文本,去除水印(台标)文本

  • 去除重复字幕行,生成srt字幕文件

  • 支持视频字幕批量提取(打开文件的时候选择多个视频)

  • 多语言:支持简体中文(中英双语)、繁体中文、英文、日语、韩语、越南语、阿拉伯语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语等87种语言的字幕提取

  • 多模式:

    快速 - 快速提取字幕但可能丢字幕(推荐)

    精准 - 逐帧检测,不丢字幕但速度非常慢(非常不推荐)


三、下载安装

Video-subtitle-extractor 免费开源,可以前往开源地址下载安装。其中提供CPU和GPU两个版本,有N卡的朋友可以选择GPU版本使用。

20231011-2512-003.jpg


Video-subtitle-extractor 采用本地进行OCR识别,无需设置调用任何API,不需要接入百度、阿里等在线OCR服务即可本地完成文本识别,支持GPU加速,GPU加速后可以获得更高的准确率与更快的提取速度,(CLI版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域。