文章目录(快捷跳转)
简介说明
音谷 - AI 多角色多情绪配音平台 github开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。
定位:为小说、剧本、视频等内容提供多角色、多情绪的 AI 语音合成与配音服务
主要功能:
- 小说 / 剧本文本导入
- 多角色角色库管理
- 情绪音色选择与绑定
- 台词自动拆分与配音生成
- 批量任务管理与导出
- 支持自定义 LLM 接口选择与调用
- 基于Index-TTS-2.0的多情绪TTS服务
- 支持精准的音频编辑功能,可以自定义删除音频片段或者添加静音片段
- 支持自定义提示词,适配个性化拆分需求
🛠 技术栈
- 前端:Electron + Vue + Element Plus
- 后端:FastAPI / Python
- AI 接口:兼容 OpenAI API 协议的大模型
- TTS 服务:IndexTTs-2 + Cloud Native Build 平台(免费 H20 显卡支持)/ 本地部署整合包
二次开发说明
本软件依据 AGPL-3.0 开源许可协议发布。基于本项目进行二次开发时,开发者须遵守以下规范:
1. 署名要求
必须在衍生软件的用户界面及代码文档中清晰标注:
"本软件基于开源项目《音谷》二次开发"
并附上原项目仓库链接。
2. 商业使用限制
未获得书面商业授权前,任何基于本项目的衍生作品不得用于商业用途或提供商业服务。
🚀 快速开始
1️⃣ 克隆项目
git clone https://github.com/xcLee001/SonicVale.git cd SonicVale
2️⃣ 启动后端
首先,需要下载ffmpeg.exe到app/core/ffmpeg/ffmpeg.exe
可以去官网ffmpeg 。也可以使用此镜像
然后复制到app/core/ffmpeg/目录下
安装依赖和启动服务
cd SonicVale pip install -r requirements.txt uvicorn app.main:app --reload --port 8200
项目结构:
app/ ├── core/ # 全局配置、tts引擎、llm引擎、ffmpeg封装、字幕生成、websocket、异步队列 ├── db/ # 数据库连接和Base ├── models/ # ORM模型 ├── dto/ # 数据传输对象(请求/响应验证) ├── entity/ # 实体类(结合 ORM 与业务层) ├── repositories/ # 数据库封装 ├── services/ # 核心业务逻辑 ├── routers/ # FastAPI路由接口 └── main.py # FastAPI启动入口
3️⃣ 启动前端
cd sonicvale-front npm install # 安装依赖 npm run start # 启动前端包括electron
图片预览











下载地址
https://github.com/xcLee001/SonicVale
https://pan.baidu.com/s/1VUvGn6rh-NwNZsnxmWSYXw?pwd=a9dx 提取码: a9dx
点击链接或复制整段内容,打开「夸克APP」即可获取。
/~80413Y1Tuf~:/
链接:https://pan.quark.cn/s/b4289b4f8b72







评论抢沙发