语音处理
EmotiVoice
一款功能强大的开源文本到语音(TTS)引擎,该引擎的特色在于其情感合成功能,能够合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音,为用户提供丰富的声音体验
netease-youdao Apache-2.0 license
TTS-Vue
一款集成了微软语音合成技术的开源免费工具,它基于Electron、Vue、ElementPlus和Vite框架构建,专门用于将文本转换为语音。
LokerL MIT license
notesGPT
一款创新的语音笔记工具,它能够录制用户的语音内容,并自动将这些语音转换成文字。
nutlope MIT license
WhisperFusion
一个创新的语音交互系统,为需要快速、准确对话处理的场合提供了强大的技术支持,无论是在客户服务还是其他需要实时语音识别和响应的领域,都能发挥重要作用。
collabora 自定义
Whisper
一款先进的开源音频转文字语音识别模型。它通过在多样化音频数据集上的训练,实现了多语言的语音识别、翻译和语言检测功能。
openai MIT license