系统要求
组件 | 最低要求 | 备注 |
---|---|---|
显存 | 8GB 或更高 | 4GB NVIDIA GPU 也能运行但速度较慢 |
内存 | 16GB 或更高 | |
磁盘空间 | 50GB 以上 |
性能测试
配置和环境:e3-1275v5 + 2080ti + 32GB DDR4,Ubuntu 22.04
运行时显存占用如下(ollama 运行 qwen-7b:q4_k_m)
5分钟有声书,共902字,所有功能拉满,总耗时 42.56s,但一般只需要生成字幕+标题生成,只需要 9s 即可执行完毕
处理项目 | 耗时 |
---|---|
背景音移除 | 13.01s |
生成字幕 | 8.83s |
文本矫正 | 11.26s |
多语言翻译 | 11.03s |
标题生成 | 0.23s |
使用“处理服务器本地音频”页面功能更适合文件批量处理,只需要放到
/mnt/data/xxx/
目录下然后给定配置即可,直接在服务器本地处理可以省去很多文件上传下载、打包的资源消耗,还可以变相实现离线处理,等待生成完毕即可