软件的语音识别基于 Openai-whisper 离线模型、文字翻译使用Google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,支持 12 种语言
可以直出外语至中文字幕以及中文语音效果视频
视频:马斯克和苏纳克对 AI 的讨论(前5分钟
语音识别模型:whisper base
我的主观感受是它对苏纳克的语言识别和翻译比较准确,准确度有8成左右,对马斯克则稍微差些,可能准确度6成左右
当然苏纳客是英伦腔,所以吐字清晰一些识别率也高些。如果有这方面需求的还可以下载大杯版本的 whisper 模型,估计效果会更佳
PS:支持日语,未测试
📮投稿 📢频道 💬群聊