找回密码
 立即注册
查看: 135|回复: 2

WhisperDesktop1.8音频转文字软件双向【免费开源】

[复制链接]
发表于 2023-5-24 02:21:49 | 显示全部楼层 |阅读模式
可实现本地电脑的音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)

特征
基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
比 OpenAI 的实现快得多。
混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT
内置性能分析器,可测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
用于音频捕获的语音活动检测。

ggml-medium 语音模型(官方):
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

作者推荐ggml-medium.bin(大小为 1.42GB)
链接:https://pan.baidu.com/s/1xcemqdg_H5OWMlDx4hzcuQ?pwd=fk2d
提取码:fk2d

蓝奏下载(最小的体验包):https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1

Whisper :开源项目(官方)
https://github.com/Const-me/Whisper

下载 :
游客,如果您要查看本帖隐藏内容请回复
回复

使用道具 举报

发表于 2023-8-22 18:25:15 | 显示全部楼层
6666666666666666666666
回复

使用道具 举报

发表于 2023-8-24 12:32:55 | 显示全部楼层
6666666666666666666666666
回复

使用道具 举报

Archiver|小黑屋|CG分享网 CG教程 CG模型 设计素材

GMT+8, 2025-4-24 17:11 , Processed in 0.060622 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表