今夕声工坊 NowVoice:让文字开口,让角色有声 在线可商用聚合配音平台

文章目录(快捷跳转)

软件介绍
今夕声工坊 NowVoice,让文字开口,让角色有声

今夕声工坊 NowVoice 是从 IndexTTS 今夕版继续进化而来的本地离线优先 AI 配音工作台。它不再只是一个单模型语音合成界面,而是把语音克隆、普通合成、AI 音色设计、统一音色库、字幕配音、剧本工坊、模型中心和开放 API 组合到同一个工作流里。

它面向短视频解说、小说配音、角色对白、课程旁白、有声内容和批量音频生产。核心目标很直接:让创作者不用在多个脚本、多个模型 Demo、多个音频工具之间来回切换。

你可以先 AI 设计音色或上传自己的音色,再选择合适的语音模型,上传字幕或剧本,绑定角色,绑定音色,最后批量生成并导出音频。对创作者来说,这是一条从文字到成品声音的完整生产线。

NowVoice 一站式 AI 配音生产线

软件理念

NowVoice 的理念是:本地优先、流程完整、模型开放、体验可靠。

本地优先,是指模型资源、音色库、字幕、剧本、输出音频都尽量放在项目目录内。部署完整后,运行期不依赖隐藏下载。对于创作者来说,这意味着环境更可控,项目更容易备份、迁移和复现。

流程完整,是指它不是只解决“把一句话读出来”,而是覆盖从音色准备到批量成片的完整链路。更完整的使用路径可以概括为:AI 设计音色或上传音色,选择模型,上传字幕或剧本,绑定角色,绑定音色,生成导出。

模型开放,是指 NowVoice 不把用户锁死在单一模型里。IndexTTS 是内置默认路线,外部还可以按能力切换 Qwen3TTS、OmniVoice、MOSS-TTS-Nano、VoxCPM、dots.tts 等语音引擎。模型排名不分先后,适合什么用途就选什么模型。

体验可靠,是指软件会尽量把复杂问题提前暴露出来。例如缺权重、缺参考文本、显存不足、worker 未启动、外部模型参数不兼容、音色库字段缺失等问题,都会尽量在界面上给出明确提示,而不是让用户只看一堆报错日志。

NowVoice 本地离线优先

核心功能

语音克隆与普通合成

NowVoice 支持单句语音克隆和普通文本合成。用户可以上传参考音频,填写参考音频文本,也可以从音色库直接选择已有音色。对于 Qwen3TTS 这类模型,还提供“仅用说话人向量”的模式,适合没有参考文本时快速生成。

不同模型有不同特性:有的更适合自然朗读,有的更适合高相似度克隆,有的适合长文本,有的适合快速出声。NowVoice 把这些差异整理到统一界面里,减少用户反复试错。
NowVoice 多模型配音工作台

AI 音色设计与统一音色库

音色设计是 NowVoice 一站式流程里的重要入口。用户可以先通过 AI 设计一个适合场景的声音,例如短视频专业解说女声、小说旁白、角色对白声线,再保存进音色库反复使用。

统一音色库是声音资产管理区。每个音色不仅保存音频文件,还可以保存参考音频文本、描述、标签、补充说明和来源信息。这样在剧本工坊、字幕配音和 API 调用时,系统可以自动带出参考文本,减少漏字、错序和声音失真。

由于一些模型对参考音频文本依赖明显,建议尽量统一、准确填写参考音频文本。参考文本越准确,OmniVoice、VoxCPM、dots.tts 等外部模型在克隆和长文本生成时越稳定。

NowVoice 统一音色库

字幕配音

字幕配音面向 SRT 等字幕文件场景。用户可以导入字幕,选择角色识别模式,给不同角色绑定不同音色,然后批量生成配音。它适合视频剪辑、课程讲解、短剧配音和多角色内容。

相对于手工逐句生成,字幕配音可以保持行号、时间线和角色映射,减少重复操作。

剧本工坊

剧本工坊面向更复杂的长文本和多角色剧本。它可以解析角色、绑定音色、按行生成音频,并拼接成完整作品。对于不支持 IndexTTS 情绪系统的外部模型,NowVoice 会自动过滤剧本里的情绪字段,避免把不兼容参数传给模型导致异常。

这让 NowVoice 不只是“语音合成工具”,而更接近一个小型配音生产台。一个典型流程是:上传剧本,识别角色,给角色绑定音色,选择模型,生成分段音频,再导出完整作品。

NowVoice 字幕配音和剧本工坊

模型中心与资源安全面板

外部模型通常加载慢、占显存大。NowVoice 增加了模型中心,用于查看模型状态、加载、预热、卸载和重启 worker。资源安全面板会显示系统内存、显存和外部 worker 状态,帮助用户判断是否需要释放模型。

对于小显存机器,可以选择切换模型时真正停止旧 worker;对于大显存机器,也可以保留 worker 常驻,提高后续生成速度。

NowVoice 模型中心和资源安全面板

开放 API 与音谷 SonicVale 对接

NowVoice 保留阅读 API,并增加 SonicVale 音谷兼容接口。用户可以不改音谷源码,只在音谷后台配置不同的 API 地址,让不同模型参与配音。

对于不支持情绪向量的外部模型,API 会自动忽略音谷传来的情绪字段,避免参数污染。对于需要参考音频文本的模型,NowVoice 会尽量从本地音色库补齐参考文本。

NowVoice 开放 API 与 SonicVale 对接

从 IndexTTS 今夕版进化而来

IndexTTS 今夕版的重点,是把 IndexTTS 的语音合成、情感控制、音色管理、多音字、字幕和剧本流程做成更易用的整合包。NowVoice 在这个基础上继续扩大范围,变成多模型配音平台。

相对于之前版本,NowVoice 强化了多模型外部 worker 架构,让 Qwen3TTS、OmniVoice、MOSS-TTS-Nano、VoxCPM、dots.tts 等模型独立运行,减少对主 WebUI 环境的污染。

它还加入了插件化模型接入、模型中心、统一音色库增强、外部模型字幕与剧本流程、SonicVale 音谷兼容接口、仙宫云部署适配、本地离线边界提示,以及发布与轻量包流程。

NowVoice 从 IndexTTS 今夕版进化而来

界面预览

1. 多模型管理中心(一)

今夕声工坊 NowVoice 多模型管理中心界面一

2. 多模型管理中心(二)

今夕声工坊 NowVoice 多模型管理中心界面二

3. 语音克隆与文字转语音模型选择

语音克隆、普通文字转语音均可按需要选择不同模型,便于对比速度、音质和克隆效果。

语音克隆和文字转语音可选择模型效果

4. 多模型可选音色设计界面

多模型可选音色设计界面

5. 单音色设计专用页面

单音色设计专用页面匹配

6. 音色库管理界面

音色库可填写参考文本、描述和标签,并联动自动音色匹配,方便字幕配音、剧本工坊和 API 调用时复用。

音色库管理界面,可填写参考文本、描述和标签

7. 音色库导入导出

音色库支持导入、导出音色库压缩包,方便创作资料迁移和备份。

音色库导入导出音色库文件压缩包

8. SRT 字幕文件配音可选模型

SRT 字幕文件配音可选模型

9. 剧本工坊可选模型

剧本工坊可选模型界面

10. 音谷 SonicVale API 对接页面

音谷 SonicVale API 对接页面

11. 音谷 SonicVale API 对接帮助页面

音谷 SonicVale API 对接帮助页面

12. 阅读 APP 听书 API 接入页面

阅读 APP 听书 API 接入页面

13. 阅读 APP 听书 API 可选模型列表

阅读 APP 听书 API 可选模型列表

14. 阅读 APP 听书音色库自选音色

阅读 APP 听书音色库自选音色

适合哪些人

短视频创作者,可以用它快速生成解说、口播、剧情配音。

小说和剧本创作者,可以给多个角色绑定不同声音,批量生成对白。

课程和知识内容制作者,可以把讲稿转换成自然旁白。

本地部署用户,可以尽量把模型和数据保存在自己的机器或服务器上。

工具集成用户,可以通过阅读 API、SonicVale 或自定义脚本调用 TTS。

NowVoice 适合创作者的声音工作台

使用建议

如果你是第一次使用,建议先从内置 IndexTTS 或一个外部模型开始,不要同时加载所有模型。先在音色库里准备好常用参考音频,并尽量补齐“参考音频文本”。

如果你要做长剧本或字幕配音,建议先用 2 到 3 行做小样,确认角色、音色、模型和参数都正确,再批量生成完整内容。

如果部署在服务器或仙宫云,建议先完整下载模型资源,再进入离线运行状态。这样正式使用时不会被网络速度、下载失败或模型版本变化影响。

商用与版权提醒

NowVoice 优先整理和集成许可证相对清晰的语音引擎,但这不等于所有生成结果都天然可以商用。模型本身的许可证、参考音频的授权、角色声音的来源、发布平台规则,都需要分别确认。

如果你上传的是未经授权的人声、影视片段、课程录音或他人作品音频,即使软件和模型允许商用,也不代表你可以把克隆结果用于商业发布。

NowVoice 商用与声音版权提醒

在线体验地址
在线体验地址

未经允许不得转载:网站源码、软件资源与技术教程分享 - 今夕资源网 » 今夕声工坊 NowVoice:让文字开口,让角色有声 在线可商用聚合配音平台
扫码在手机上阅读本页
赞(0)

评论抢沙发

评论前必须登录!