简介说明
OmniVoice今夕版文本转语音、语音克隆、音色设计、自动音色、字幕配音、多人小说剧本 漫画配音 生成、一键绑定音色 电影漫剧配音生成 多音字发音 音色库管理 阅读APP接入
OmniVoice 今夕定制版升级说明
一、本次升级重点
本次定制版最核心的升级,不是改模型本体,而是把 OmniVoice 做成了更适合本地直接使用的中文工作台。
二、多角色字幕生成音频功能说明
1. 这是什么功能
现在可以直接把字幕内容拿来配音,不再只是单条文本合成。
如果字幕里带有角色标记,系统可以识别不同角色,并为不同角色分配不同音色,再一次性生成整段配音音频。
适合的场景包括:
- 小说对话配音
- 剧本台词配音
- 漫画解说配音
- 视频字幕重配音
- 多人物旁白与对白混合配音
2. 支持的两种字幕配音模式
字幕配音现在分为两种模式:
模式一:识别角色配音
- 适合字幕中带有角色名的内容
- 例如:
【旁白】天色渐暗,风吹过长街。
【角色A】你终于来了。
【角色B】我已经等你很久了。
- 系统会尝试识别出“旁白”“角色A”“角色B”等角色
- 然后可以分别给每个角色绑定不同音色
模式二:纯字幕顺序配音
- 不识别角色
- 完全按照字幕原本的顺序一条一条合成
- 适合普通字幕、旁白稿、单人解说、无角色标记字幕
3. 多角色字幕配音现在能做什么
- 自动识别字幕中的角色名
- 在页面中直接显示“识别到的角色列表”
- 不用手写角色映射
- 可以点选角色后绑定音色
- 支持单选角色绑定
- 支持多选角色批量绑定
- 支持全选角色一键绑定同一个音色
- 支持清空当前角色选择
- 支持设置默认参考音色
- 如果某个角色没有单独绑定,也可以回退到默认音色
- 生成完成后可直接输出整段音频
- 支持同时输出对应字幕文件
4. 实际使用流程
推荐使用流程如下:
第一步:进入“字幕配音”页面
第二步:粘贴字幕内容,或导入字幕
第三步:选择字幕配音模式
- 字幕里有角色名,就选“识别角色配音”
- 普通字幕无角色区分,就选“纯字幕顺序配音”
第四步:让系统识别角色
- 页面会直接列出识别出的角色
第五步:从音色库中选择音色
- 可以给单个角色绑定
- 也可以多选后批量绑定
- 也可以全选后绑定同一个音色
第六步:点击生成
- 系统会把整段字幕自动配成完整音频
5. 和旧版相比,提升在哪里
旧版更多偏向单段文本转语音或单次参考音频合成。
本次升级后,字幕配音已经从“能用”提升到“可实际做项目”:
- 从单句合成,提升到整段字幕工作流
- 从单音色,提升到多角色分配
- 从手工记角色名,提升到界面可视化绑定
- 从一次一次切换参考音频,提升到直接调用音色库
- 从只出音频,提升到可同时配合字幕整理与字幕输出
三、围绕多角色字幕配音的配套增强
为了让多角色字幕生成音频真正好用,还同步做了这些增强:
1. 音色库增强
- 支持保存音色
- 支持删除音色
- 支持重命名音色
- 支持编辑备注
- 支持搜索
- 支持分页浏览
- 支持预览
- 支持一键应用到当前表单
- 支持一键应用到字幕配音默认音色
2. 默认音色增强
- 可以从音色库中直接选择默认参考音频
- 没有单独绑定角色时,可以自动使用默认音色
3. 角色绑定增强
- 支持识别到角色后直接操作
- 支持单个角色绑定
- 支持多选角色批量绑定
- 支持全选角色统一绑定
- 更适合“一个人被误识别成多个名字”这类情况
4. 字幕整理增强
- 支持字幕整理
- 支持生成前先清洗字幕内容
- 支持生成后输出字幕文件
四、其他同步升级内容
除了多角色字幕生成音频,本次还一并升级了这些内容:
1. 语音工作台增强
- 优化了页面布局
- 优化了按钮位置
- 生成时增加了更明显的交互反馈
- 支持把当前结果快速保存到音色库
2. 发音覆盖增强
- 支持更直观的多音字/发音覆盖输入
- 支持拼音数字声调写法
- 支持词组级覆盖
- 更适合中文多音字修正
3. API 页面增强
- 新增阅读 API 页面
- 支持在页面中查看接口用法
- 支持动态显示当前访问地址
- 支持结合音色库生成 API 调用规则
4. 页面中文化增强
- 页面大量中文提示进行了定制化处理
- 更适合中文用户直接理解和使用
5. 启动与检测增强
- 启动脚本适配本地相对目录
- 检测环境脚本适配相对目录
- 对未安装系统 Python 的机器更友好
五、文件结构说明
- 启动.bat
启动逻辑改为更适合本地整合包使用的方式
- 检测环境.bat
检测逻辑适配整合包相对目录
- env_check.ps1
发布版环境检测逻辑增强
六、发布版使用建议
如果你最常用的是字幕配音,建议这样使用:
- 先在音色库保存好常用角色音色
- 再进入字幕配音页面导入字幕
- 选择“识别角色配音”
- 观察识别出的角色列表
- 逐个绑定或批量绑定音色
- 最后一次性生成整段音频
如果字幕本身没有角色区分,就直接选择:
“纯字幕顺序配音”
七、本次升级的核心价值可以概括为一句话:
把 OmniVoice 从“单条文本语音工具”,升级成了“可直接用于多角色字幕配音的本地中文工作台”。
尤其是多角色字幕生成音频,现在已经具备:
- 角色识别
- 角色列表显示
- 多角色音色分配
- 批量绑定
- 默认音色回退
- 音色库联动
- 字幕整理与输出
更适合真正拿来做配音项目,而不只是做单次测试。
图片预览






下载地址






评论抢沙发