简介说明
小红书开源语音 TTS 工具 dots.tts 今夕一键整合包,是一款面向本地语音合成、音色克隆和多语言配音的 Windows 便携版工具。
它的核心能力很直接:输入文字,即可生成自然、清晰、有表现力的语音;上传参考音频,还可以进行音色迁移,让生成结果更接近指定说话人的声音特征。
本整合版已经整理好运行环境、模型文件、缓存目录、日志目录和输出目录。用户无需手动部署 Python 环境,也不需要重新安装复杂依赖,双击 start_webui.bat 后即可打开 WebUI 页面使用。
默认访问地址为:
http://127.0.0.1:7870/
在功能上,dots.tts 适合多种本地创作场景。普通配音模式适合短视频旁白、小说对白、课程解说、产品介绍和普通文本朗读。
指令式配音模式适合控制语气、情绪、语速和角色感,例如输入“请用温柔慢速的语气说……”这类提示,让生成声音更接近指定表达方式。
声音描述生成模式适合探索声音风格,例如描述“室内安静、女声、语速适中、情绪稳定、发音清晰”,用于生成更具风格感的语音效果。
本版本还开放了语言和方言选择,包括普通话、粤语、北京话、东北话、四川话、闽南话、吴语,以及英文、日语、韩语、西班牙语等多语言示例。
如果要生成粤语内容,建议直接输入粤语口语文本,并在“语言 / 方言”中选择“粤语”,这样更容易得到符合语境的生成效果。
音色克隆是 dots.tts 的重要能力。使用时可以上传 5 到 15 秒左右的参考音频。如果同时填写参考音频转写,转写内容必须和参考音频中实际说的话一致,这样模型才能更稳定地学习参考语音的节奏、音色和发音方式。
参考音频越清晰,背景噪音越少,生成结果通常越稳定。
本整合版界面提供了快速示例,包含官方 README 文本示例、普通话示例、多种方言示例、多语言示例、指令式配音示例,以及声音描述示例。用户可以先通过这些示例理解不同模式的差异,再替换成自己的文本进行创作。
需要注意的是,dots.tts 可以生成高拟真语音,建议用于授权创作、个人学习、本地部署、内容生产和合规配音场景。不要使用未经授权的参考音频进行冒充、欺骗、诈骗、误导传播或其他不当用途。公开发布合成音频时,建议明确标注为 AI 生成内容。
总体来说,dots.tts 本地整合版适合希望在本机完成语音生成、角色配音、方言试听、音色实验和短内容配音的用户。它的优势在于便携、本地化、功能直观、参数可控,并且可以通过参考音频快速探索不同音色效果。
图片预览
dots.tts 首页截图

dots.tts 自带示例选择列表截图,包含普通话、粤语、方言、多语言和声音描述示例。

dots.tts 合成模式截图,支持普通配音、指令式配音和声音描述生成。

dots.tts 语言和方言选择截图,可选择普通话、粤语、地方方言和多语言标签。

dots.tts 高级参数截图,可调整采样步数、引导强度、音色强度、随机种子等参数。

下载地址
https://pan.quark.cn/s/79111f2f3685
https://pan.baidu.com/s/1sTJykDpIKc9xgs6uZG_-rA?pwd=7fug 提取码: 7fug







评论抢沙发