文章目录(快捷跳转)
简介说明
IndexTTS API 是一套基于本地部署的语音合成接口,支持文本转语音、音色选择、语速调节等功能,启动后可通过 HTTP 请求调用,以下为完整使用说明。
服务启动方式
整合包启动
Windows 环境下直接双击运行 API.bat 启动脚本,等待模型加载完成。
默认服务地址:http://localhost:7860
手动命令启动
在项目目录下执行启动命令:
python api.py
默认监听端口 7860 或 8000,可在配置文件中修改。
接口基础信息
请求方式:POST
默认接口地址:http://localhost:7860/api/tts
请求头:Content-Type: application/json
请求参数说明
| 参数名 | 类型 | 是否必填 | 说明 |
| text | string | 是 | 需要合成语音的文本内容 |
| voice | string | 否 | 音色标识,根据模型选择对应音色 |
| speed | float | 否 | 语速,范围 0.5~2.0,默认 1.0 |
| format | string | 否 | 输出格式,支持 wav、mp3、base64 |
完整请求示例
{
"text": "欢迎使用 IndexTTS 语音合成接口",
"voice": "默认音色",
"speed": 1.0,
"format": "base64"
}
Python 调用示例
import requests
import base64
url = "http://localhost:7860/api/tts"
data = {
"text": "测试语音合成",
"speed": 1.0,
"format": "base64"
}
response = requests.post(url, json=data)
result = response.json()
audio_data = base64.b64decode(result.get("audio_base64"))
with open("output.wav", "wb") as f:
f.write(audio_data)
Gradio 接口兼容格式
部分版本使用 Gradio 启动,接口路径为 /api/predict/,请求格式如下:
{
"data": [
"需要合成的文本",
"",
"neutral",
0.7
]
}
常见问题说明
启动失败:检查 Python 环境、模型文件是否完整,显卡显存是否满足运行要求。
接口无法访问:确认端口未被占用,服务已正常启动,防火墙未拦截。
合成无音频:检查文本是否为空,参数格式是否正确,音色是否存在。
返回异常:缩短文本长度,避免特殊符号过多,重新发送请求。
图片预览

下载地址
https://pan.baidu.com/s/1uozuJ_EPB6O-jAp4nO25jg?pwd=wxbx 提取码: wxbx







评论抢沙发