系统要求和性能测试

系统要求

配置和环境：e3-1275v5 + 2080ti + 32GB DDR4，Ubuntu 22.04
运行时显存占用如下（ollama 运行 qwen-7b:q4_k_m）

5分钟有声书，共902字，所有功能拉满，总耗时 42.56s，但一般只需要生成字幕+标题生成，只需要 9s 即可执行完毕

使用“处理服务器本地音频”页面功能更适合文件批量处理，只需要放到 /mnt/data/xxx/ 目录下然后给定配置即可，直接在服务器本地处理可以省去很多文件上传下载、打包的资源消耗，还可以变相实现离线处理，等待生成完毕即可