音频转字幕加载模型卡住怎么办
在线音频转字幕首次使用时,浏览器需要从 ModelScope 加载 Whisper tiny/base 模型。如果进度长时间停在加载模型、资源请求失败或转写没有继续,可以先按下面几类原因排查。
优先检查网络和模型来源
当前工具锁定 ModelScope 外部仓库。模型配置、分词器和 ONNX 文件都需要浏览器能够正常访问 ModelScope。如果网络中断、请求返回 404、下载为 0B,或者浏览器缓存了异常文件,模型加载就可能卡住或失败。
优先用 tiny 排查
排查时建议先选择 tiny。tiny 文件更小,更容易判断问题是网络、浏览器运行环境还是音频文件本身。如果 tiny 可以完成转写,再尝试 base;如果 tiny 也失败,优先检查浏览器控制台里的资源请求和错误信息。
常见失败位置
如果卡在 config、tokenizer 或 preprocessor,通常是模型仓库连接或 URL 请求问题;如果 ONNX 文件下载完成后失败,通常和浏览器 WebAssembly、ONNX Runtime 初始化或模型文件兼容性有关;如果模型已就绪但转写失败,则需要检查音频是否能被浏览器解码。
常见问题
Q:加载模型一直卡住怎么办?
优先确认浏览器能访问 ModelScope,刷新页面后重新选择 tiny 模型测试;如果网络不稳定,首次加载大模型文件时可能需要等待更久。
优先确认浏览器能访问 ModelScope,刷新页面后重新选择 tiny 模型测试;如果网络不稳定,首次加载大模型文件时可能需要等待更久。
Q:为什么会提示模型加载或资源请求失败?
常见原因包括 ModelScope 连接失败、浏览器缓存异常、模型文件下载中断、浏览器不支持所需的 WebAssembly 能力,或音频文件本身无法解码。
常见原因包括 ModelScope 连接失败、浏览器缓存异常、模型文件下载中断、浏览器不支持所需的 WebAssembly 能力,或音频文件本身无法解码。
Q:为什么 tiny 比 base 更容易先跑通?
tiny 模型文件更小,下载和初始化压力更低,适合作为首次测试和排查问题时的默认选择。
tiny 模型文件更小,下载和初始化压力更低,适合作为首次测试和排查问题时的默认选择。
Q:浏览器音频转字幕对设备有什么要求?
浏览器需要支持 WebAssembly 和音频解码能力,设备内存和 CPU 性能也会影响模型加载、初始化和转写速度。
浏览器需要支持 WebAssembly 和音频解码能力,设备内存和 CPU 性能也会影响模型加载、初始化和转写速度。
开源项目说明
今夕在线音频转文本工具提供官方在线版,也整理了可供学习和二次部署的开源版本。想本地化部署、查看实现思路或基于浏览器端 Whisper 转写方案继续开发,可以先阅读开源项目介绍。