LiberSonora

一个 AI 赋能的、强大的、开源有声书工具集

LiberSonora

系统要求和性能测试

系统要求

组件 最低要求 备注
显存 8GB 或更高 4GB NVIDIA GPU 也能运行但速度较慢
内存 16GB 或更高
磁盘空间 50GB 以上

性能测试

配置和环境:e3-1275v5 + 2080ti + 32GB DDR4,Ubuntu 22.04
运行时显存占用如下(ollama 运行 qwen-7b:q4_k_m)

显存占用

5分钟有声书,共902字,所有功能拉满,总耗时 42.56s,但一般只需要生成字幕+标题生成,只需要 9s 即可执行完毕

处理项目 耗时
背景音移除 13.01s
生成字幕 8.83s
文本矫正 11.26s
多语言翻译 11.03s
标题生成 0.23s

使用“处理服务器本地音频”页面功能更适合文件批量处理,只需要放到 /mnt/data/xxx/ 目录下然后给定配置即可,直接在服务器本地处理可以省去很多文件上传下载、打包的资源消耗,还可以变相实现离线处理,等待生成完毕即可

0%