专注分享各种高质量网站、工具、APP、开源项目等一切好玩的东西🚀,以及偶尔开开车🚗

🔍内容索引 @GeeksoBot
💬加入话题 @igeekshare
📮广告合作 @Geekshare_bot
#开源 #音频处理 #AI

💬Whisper-WebUI - 为 Whisper 提供 WebUI

支持从文件、YouTube、麦克风等多种来源生成字幕、语音转文本、文本翻译、音频处理等功能

在 Pinokio 中搜索「Whisper-WebUI」即可使用

Whisper 是 OpenAI 开发的通用语音识别开源模型


📑相关阅读

▫️
Pinokio - 真「一键」部署 AI 大模型神器!
▫️视频翻译和配音 - 将视频从一种语言翻译为另一种语言,并添加配音


📮投稿 📢频道 💬群聊 🔎索引
#开源 #音频处理 #AI

🔊 简易语音工具箱 - 一个基于开源语音项目实现的音频工具箱

支持音频处理、语音识别、语音转录、数据集制作、模型训练、语音合成

目前仅支持独立显卡(N卡)

界面有些许简陋,第一次进入各种报错,需要等待下载依赖或直接下载懒人包。但实际效果还算不错,可以自己制作一些鬼畜BGM了


📮投稿 📢频道 💬群聊 🔎索引
#开源 #音频处理 #AI

🔉 ChatTTS - 最近很火爆的文本转语音项目

视频演示


在线体验


开发者声称该项目突破了开源天花板!最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本(无版权风险)

ChatTTS 无障碍支持中英文,还支持一些细粒度控制,允许加入笑声、说话停顿、语气词等

它还可以复刻已经逝去的人的绝版声音,看演示视频不论是语调还是语气的变化,都挺接近本人的

在线体验一波真的非常好玩,再这么玩下去,播音员都要失业了


📮投稿 📢频道 💬群聊 🔎索引
 
 
Back to Top