找回密码
 立即注册
查看: 1678|回复: 98

不再啃生肉,借助OpenAI语音识别模型批量生成高精度字幕

 火.. [复制链接]
发表于 2023-8-7 10:15:07 | 显示全部楼层 |阅读模式
本帖最后由 Raindrop 于 2023-8-7 22:11 编辑

外网下的教程没有字幕,又不想付费于是便想到了使用语音识别模型Whisper生成字幕,识别准确率高于市面上绝大多数语音识别服务,几乎没有识错单词,关于这个模型的介绍:https://github.com/openai/whisper

除非你对你的显卡显存非常自信,否则建议还是借助Colab等平台来完成批量任务吧。

这里分享自己的Colab笔记本,使用需要科学上网和一个可用的Google账号,所有任务将在云端完成,挂载自己的云端硬盘后设置任务文件夹即可,可选参数见笔记本(整个过程上传的视频和生成结果都在自己的Google云端硬盘中,共享笔记本的所有者看不到你的任何个人数据,只有你自己能看到)生成的结果会保存在指定文件夹中。

注意:目前官方仅提供其它语言到英文的翻译,想要将识别的英文字幕翻译成中文需要借助第三方工具,这里分享一个小技巧,直接用Chrome浏览器打开字幕文件即可翻译文本,或者更好的方法,假如你使用的是其它浏览器你可以借助脚本/扩展实现字幕翻译和制作双语字幕文件(附修复Google翻译的工具)




游客,如果您要查看本帖隐藏内容请回复




码字不易,求各位大佬赏个评分吧

评分

参与人数 2C分 +8 收起 理由
2377677997 + 3
Nature + 5 好用,感谢分享

查看全部评分

回复

使用道具 举报

发表于 2023-8-7 10:16:37 | 显示全部楼层
11111111111111111111
回复

使用道具 举报

发表于 2023-8-7 10:31:05 | 显示全部楼层
4444444444444444
回复

使用道具 举报

发表于 2023-8-7 10:39:14 | 显示全部楼层
66666666666666666666
回复

使用道具 举报

发表于 2023-8-7 10:40:19 | 显示全部楼层
6666666666666666666666666
回复

使用道具 举报

发表于 2023-8-7 10:46:39 | 显示全部楼层
6666666666666
回复

使用道具 举报

发表于 2023-8-7 11:25:39 | 显示全部楼层
6666666666666666
回复

使用道具 举报

头像被屏蔽
发表于 2023-8-7 13:28:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2023-8-7 14:47:29 | 显示全部楼层
回复

使用道具 举报

发表于 2023-8-7 15:30:16 | 显示全部楼层
感谢分享
回复

使用道具 举报

Archiver|小黑屋|CG分享网 CG教程 CG模型 设计素材

GMT+8, 2025-2-3 12:04 , Processed in 0.033160 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表