小红书开源 TTS 工具 dots.tts 一键整合包源码：无需部署，开盒即用的本地 AI 语音合成工具

文章目录（快捷跳转）

简介说明

小红书开源语音 TTS 工具 dots.tts 今夕一键整合包，是一款面向本地语音合成、音色克隆和多语言配音的 Windows 便携版工具。

它的核心能力很直接：输入文字，即可生成自然、清晰、有表现力的语音；上传参考音频，还可以进行音色迁移，让生成结果更接近指定说话人的声音特征。

本整合版已经整理好运行环境、模型文件、缓存目录、日志目录和输出目录。用户无需手动部署 Python 环境，也不需要重新安装复杂依赖，双击 start_webui.bat 后即可打开 WebUI 页面使用。

默认访问地址为：

http://127.0.0.1:7870/

在功能上，dots.tts 适合多种本地创作场景。普通配音模式适合短视频旁白、小说对白、课程解说、产品介绍和普通文本朗读。

指令式配音模式适合控制语气、情绪、语速和角色感，例如输入“请用温柔慢速的语气说……”这类提示，让生成声音更接近指定表达方式。

声音描述生成模式适合探索声音风格，例如描述“室内安静、女声、语速适中、情绪稳定、发音清晰”，用于生成更具风格感的语音效果。

本版本还开放了语言和方言选择，包括普通话、粤语、北京话、东北话、四川话、闽南话、吴语，以及英文、日语、韩语、西班牙语等多语言示例。

如果要生成粤语内容，建议直接输入粤语口语文本，并在“语言 / 方言”中选择“粤语”，这样更容易得到符合语境的生成效果。

音色克隆是 dots.tts 的重要能力。使用时可以上传 5 到 15 秒左右的参考音频。如果同时填写参考音频转写，转写内容必须和参考音频中实际说的话一致，这样模型才能更稳定地学习参考语音的节奏、音色和发音方式。

参考音频越清晰，背景噪音越少，生成结果通常越稳定。

本整合版界面提供了快速示例，包含官方 README 文本示例、普通话示例、多种方言示例、多语言示例、指令式配音示例，以及声音描述示例。用户可以先通过这些示例理解不同模式的差异，再替换成自己的文本进行创作。

需要注意的是，dots.tts 可以生成高拟真语音，建议用于授权创作、个人学习、本地部署、内容生产和合规配音场景。不要使用未经授权的参考音频进行冒充、欺骗、诈骗、误导传播或其他不当用途。公开发布合成音频时，建议明确标注为 AI 生成内容。

总体来说，dots.tts 本地整合版适合希望在本机完成语音生成、角色配音、方言试听、音色实验和短内容配音的用户。它的优势在于便携、本地化、功能直观、参数可控，并且可以通过参考音频快速探索不同音色效果。

图片预览

dots.tts 首页截图

dots.tts首页截图

dots.tts 自带示例选择列表截图，包含普通话、粤语、方言、多语言和声音描述示例。

dots.tts自带示例选择列表截图

dots.tts 合成模式截图，支持普通配音、指令式配音和声音描述生成。

dots.tts合成模式截图

dots.tts 语言和方言选择截图，可选择普通话、粤语、地方方言和多语言标签。

dots.tts语言和方言选择截图

dots.tts 高级参数截图，可调整采样步数、引导强度、音色强度、随机种子等参数。

dots.tts高级参数截图

下载地址

https://pan.quark.cn/s/79111f2f3685