软件简介:
官方网站:https://smartsub.linxiaodong.com
SmartSub(妙幕)是一款本地优先的一站式桌面字幕工具,覆盖了从音视频转写、翻译、校对到字幕烧录封装的全流程。它最大的特点在于所有转写都在本地完成,文件无需上传,在保障隐私的同时也能获得更快的处理速度。该工具支持 Windows、macOS 和 Linux 跨平台运行,目前已在 GitHub 上获得了超过 4.1k 的 Star。


六种转写引擎可选
SmartSub 在 3.0 版本中进行了几乎重写式的大版本更新,核心变化之一是将转写引擎从单一的 whisper.cpp 扩展到了六种可逐任务切换的引擎。这六种引擎包括内置的 whisper.cpp、faster-whisper、FunASR、Qwen3-ASR、FireRedASR 以及本地 Whisper CLI。其中,FunASR 和 FireRedASR 等引擎在中英文场景下表现尤为出色。这些引擎中,FunASR、Qwen3-ASR 和 FireRedASR 均通过内置的 sherpa-onnx 原生库运行,无需额外配置环境;而 faster-whisper 则会在应用内下载一个自包含的运行时。
GPU 加速全面升级
在 GPU 加速方面,SmartSub 3.0 进行了全面重构。除了原有的 NVIDIA CUDA 支持外,新增了 Vulkan 后端,使得 AMD 和 Intel 显卡也能在 Windows 和 Linux 上获得加速。macOS 平台(Apple 芯片)则自动启用 Core ML 或 Metal 加速。软件提供了“自动”、“仅 GPU”和“仅 CPU”三种加速模式,能够自动识别显卡、按需下载加速包,并在加载失败时自动回退到 CPU 模式。整个过程中,用户无须手动安装 CUDA Toolkit。
17 个翻译服务与 AI 自定义参数
字幕翻译功能支持多达 17 个翻译服务,涵盖了百度、谷歌、阿里云、火山引擎、腾讯、讯飞、小牛、DeepLX 等传统翻译平台,以及 Ollama(本地模型)、DeepSeek、Azure OpenAI、Gemini、通义千问、SiliconFlow 等大模型和聚合平台。软件兼容任意 OpenAI 风格 API,用户可以接入 deepseek、azure 等自有服务。输出内容可以选择纯译文或“原文 + 译文”的双语字幕格式。更灵活的是,SmartSub 支持为每个 AI 翻译服务在界面中直接配置自定义参数(包括请求头和请求体),支持 String、Float、Boolean 等多种参数类型,并可以实时验证、导入导出,方便团队共享与备份。
字幕校对与 AI 润色
字幕校对功能提供了内置的校对台,用户可以逐句对照视频进行检查和修改。校对过程中支持撤销与重做,并可以调用 AI 进行一键润色。视频预览与字幕编辑同屏呈现,让定位和调整更加精准。
硬字幕烧录与软字幕封装
视频合成方面,SmartSub 支持两种字幕嵌入方式:一是“硬字幕烧录”,将字幕永久烧进画面,在任何播放器上都能显示;二是“软字幕封装”,以流复制方式无损嵌入可切换的字幕轨。字幕样式提供了丰富的控制选项,包括字体、字号、颜色、描边、阴影以及九宫格位置,并内置了多种预设样式,所有调整都可以通过所见即所得的实时预览来确认。
全新任务式界面
在界面设计上,SmartSub 3.0 采用了全新的任务式界面,以“您想做什么?”为起点的启动台将任务、字幕校对、视频合成、引擎与模型、翻译服务等功能分区清晰呈现。软件内置了新手引导、命令面板(⌘K / Ctrl+K)以及下载与任务活动中心,降低了上手门槛。
批量处理与模型选择建议
SmartSub 支持批量处理,用户可以自定义并发任务数量,提高处理效率。在字幕生成过程中,还支持简繁转换、自定义字幕文件名,以及可选的中文字幕去标点功能,让烧录效果更加干净。对于 whisper 系列模型的选择,官方给出了参考建议:低端设备或核显推荐 tiny 或 base 模型;普通电脑可从 small 或 base 起步;高性能显卡或工作站推荐 large 系列;纯英文音视频建议选择带 en 的模型。如果模型文件下载困难,也可以通过国内镜像源或 Hugging Face 官方源手动下载后,在“引擎与模型”页面中导入。
安装说明:
直接安装主程序即可。
文章更新说明:2026年6月25日 更新 v3.1.0 版本。本站仅分流了 Windows 版安装包,其他版本请自行移步至项目地址下载。
