字幕识别支持
- ✅ 中文(zh-CN)
- ✅ 英语(en)
多语言字幕翻译支持
语言 | 支持状态 | 备注 |
---|---|---|
中文(zh-CN) | ✅ 支持 | 源语言,翻译目标语言 |
英语(en) | ✅ 支持 | 源语言,翻译目标语言 |
日语(ja) | ✅ 支持 | 翻译目标语言 |
法语(fr) | ✅ 支持 | 翻译目标语言 |
德语(de) | ✅ 支持 | 翻译目标语言 |
注意:多语言字幕翻译功能依赖于本地大模型,翻译质量可能因模型版本和上下文理解能力而有所不同
支持的大模型供应商
- Ollama: 本地运行的轻量级大模型服务,支持多种开源模型,适合本地部署
- DeepSeek: 深度求索提供的API服务,中文处理能力强,性能优异
- OpenAI: 全球领先的AI服务提供商,模型性能强大但需要网络连接
内置支持的模型列表
供应商 | 模型名称 | 说明 |
---|---|---|
Ollama | Qwen2.5-7B-Instruct-Q4_K_M | 强大的多语言模型,支持多种任务,性能优异 |
Ollama | Qwen2.5-14B-Instruct-Q4_K_M | 更强大的多语言模型,性能更优但速度较慢 |
Ollama | minicpm3-4B-Q4_K_M | 本地运行的轻量模型,运行速度快 |
DeepSeek | DeepSeek Chat | 深度求索的对话模型,适合中文场景 |
DeepSeek | DeepSeek R1 | 深度求索的COT推理模型,质量更好但更慢 |
OpenAI | GPT-4O | OpenAI的最强模型,性能最好但成本较高 |
OpenAI | GPT-3.5 Turbo | OpenAI的快速模型,性价比高 |
提示:可根据任务需求灵活选择不同模型,也可以配置其他列表中不存在的模型,本地模型无需网络连接,云端模型性能更强但需要API密钥
音乐软件字幕兼容性
软件名称 | 本地音乐 | 本地字幕支持 | 多语言字幕兼容 | 备注 |
---|---|---|---|---|
网易云音乐 | 支持 | 支持 | 兼容 | |
小米音乐 | 支持 | 支持 | 兼容 | 单语言字幕正常,但多语言字幕进度条会偏快 |
QQ音乐 | 支持 | 不支持 | 不兼容 | 只能云搜索歌词 |
酷狗音乐 | 支持 | 不支持 | 不兼容 | 只能云搜索歌词 |
酷我音乐 | 支持 | 不支持 | 不兼容 | 只能云歌词 |
汽水音乐 | 不支持 | 不支持 | 不兼容 | |
咪咕音乐 | 支持 | 不支持 | 不兼容 | |
喜马拉雅 | 不支持 | 不支持 | 不支持 | 不能导入 |
懒人听书 | 不支持 | 不支持 | 不支持 | 不能导入 |
番茄畅听 | 支持 | 不支持 | 不支持 | 导了两次,导入时不能选文件夹部分导入,卡崩了 |
蜻蜓FM | 不支持 | 不支持 | 不支持 | 不能导入 |
MacOS Apple Music | 支持 | 不支持 | 不支持 | 不能导入 lrc/src 音频 |
相比之下,目前的商业播放器在本地有声书播放场景上,还是网易云兼容性好点,但网易云的本地音乐没有进度记录或已播放的功能,切回到他的在线音乐之后很难找回进度,这也是想做全平台开源有声书播放器的原因之一
![image](/images/163-title-generated.png)
![image](/images/163-sub.png)
![image](/images/163-sub-multilang.png)