#音频处理 | 极客分享

专注分享各种高质量网站、工具、APP、开源项目等一切好玩的东西🚀，以及偶尔开开车🚗

🔍内容索引 @GeeksoBot
💬加入话题 @igeekshare
📮广告合作 @Geekshare_bot
🌐网站：https://geekshare.org/

12:45 · Jan 16, 2026 · Fri

#AI #视频处理 #音频处理

🔊

Voice-Pro - 免费开源的 AI 语音识别、翻译和多语言配音解决方案

Voice-Pro 是一个开源的音频/语音处理工具集合，现已宣告完全免费（此前收费）

✨

Features

▫️一键下载 YouTube 视频 + 人声分离：yt-dlp 下载 + Demucs 分离人声/背景乐
▫️强大的语音识别：支持 Whisper / Faster-Whisper / WhisperX / Whisper-Timestamped
▫️多语言实时/批量翻译：100+ 语言互译
▫️...

📮投稿 📢频道 💬群聊 🔎索引

AI 视频处理音频处理

06:01 · Oct 21, 2024 · Mon

#开源 #音频处理 #AI

💬Whisper-WebUI - 为 Whisper 提供 WebUI

支持从文件、YouTube、麦克风等多种来源生成字幕、语音转文本、文本翻译、音频处理等功能

在 Pinokio 中搜索「Whisper-WebUI」即可使用

Whisper 是 OpenAI 开发的通用语音识别开源模型

开源音频处理 AI

13:40 · Jun 4, 2024 · Tue

#开源 #音频处理 #AI

🔊 简易语音工具箱 - 一个基于开源语音项目实现的音频工具箱

支持音频处理、语音识别、语音转录、数据集制作、模型训练、语音合成

目前仅支持独立显卡（N卡）

界面有些许简陋，第一次进入各种报错，需要等待下载依赖或直接下载懒人包。但实际效果还算不错，可以自己制作一些鬼畜BGM了

📮投稿 📢频道 💬群聊 🔎索引

开源音频处理 AI

13:37 · Jun 3, 2024 · Mon

#开源 #音频处理 #AI

🔉 ChatTTS - 最近很火爆的文本转语音项目

视频演示

在线体验

开发者声称该项目突破了开源天花板！最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本（无版权风险）

ChatTTS 无障碍支持中英文，还支持一些细粒度控制，允许加入笑声、说话停顿、语气词等

它还可以复刻已经逝去的人的绝版声音，看演示视频不论是语调还是语气的变化，都挺接近本人的

在线体验一波真的非常好玩，再这么玩下去，播音员都要失业了

📮投稿 📢频道 💬群聊 🔎索引

开源音频处理 AI