SmartSub（妙幕）：本地优先、免费开源，一站式音视频字幕处理神器

SmartSub（妙幕）是一款本地优先、免费开源的一站式音视频字幕处理工具，支持 Windows、macOS 和 Linux。它提供六种可切换的转写引擎，内置 17 个翻译服务，支持字幕校对与 AI 润色，以及硬字幕烧录和软字幕封装。所有处理均在本地完成，无需上传文件，兼顾隐私与效率，适合视频创作者和字幕制作人员使用。

软件简介：

官方网站：https://smartsub.linxiaodong.com

SmartSub（妙幕）是一款本地优先的一站式桌面字幕工具，覆盖了从音视频转写、翻译、校对到字幕烧录封装的全流程。它最大的特点在于所有转写都在本地完成，文件无需上传，在保障隐私的同时也能获得更快的处理速度。该工具支持 Windows、macOS 和 Linux 跨平台运行，目前已在 GitHub 上获得了超过 4.1k 的 Star。

六种转写引擎可选

SmartSub 在 3.0 版本中进行了几乎重写式的大版本更新，核心变化之一是将转写引擎从单一的 whisper.cpp 扩展到了六种可逐任务切换的引擎。这六种引擎包括内置的 whisper.cpp、faster-whisper、FunASR、Qwen3-ASR、FireRedASR 以及本地 Whisper CLI。其中，FunASR 和 FireRedASR 等引擎在中英文场景下表现尤为出色。这些引擎中，FunASR、Qwen3-ASR 和 FireRedASR 均通过内置的 sherpa-onnx 原生库运行，无需额外配置环境；而 faster-whisper 则会在应用内下载一个自包含的运行时。

GPU 加速全面升级

在 GPU 加速方面，SmartSub 3.0 进行了全面重构。除了原有的 NVIDIA CUDA 支持外，新增了 Vulkan 后端，使得 AMD 和 Intel 显卡也能在 Windows 和 Linux 上获得加速。macOS 平台（Apple 芯片）则自动启用 Core ML 或 Metal 加速。软件提供了“自动”、“仅 GPU”和“仅 CPU”三种加速模式，能够自动识别显卡、按需下载加速包，并在加载失败时自动回退到 CPU 模式。整个过程中，用户无须手动安装 CUDA Toolkit。

17 个翻译服务与 AI 自定义参数

字幕翻译功能支持多达 17 个翻译服务，涵盖了百度、谷歌、阿里云、火山引擎、腾讯、讯飞、小牛、DeepLX 等传统翻译平台，以及 Ollama（本地模型）、DeepSeek、Azure OpenAI、Gemini、通义千问、SiliconFlow 等大模型和聚合平台。软件兼容任意 OpenAI 风格 API，用户可以接入 deepseek、azure 等自有服务。输出内容可以选择纯译文或“原文 + 译文”的双语字幕格式。更灵活的是，SmartSub 支持为每个 AI 翻译服务在界面中直接配置自定义参数（包括请求头和请求体），支持 String、Float、Boolean 等多种参数类型，并可以实时验证、导入导出，方便团队共享与备份。

字幕校对与 AI 润色

字幕校对功能提供了内置的校对台，用户可以逐句对照视频进行检查和修改。校对过程中支持撤销与重做，并可以调用 AI 进行一键润色。视频预览与字幕编辑同屏呈现，让定位和调整更加精准。

硬字幕烧录与软字幕封装

视频合成方面，SmartSub 支持两种字幕嵌入方式：一是“硬字幕烧录”，将字幕永久烧进画面，在任何播放器上都能显示；二是“软字幕封装”，以流复制方式无损嵌入可切换的字幕轨。字幕样式提供了丰富的控制选项，包括字体、字号、颜色、描边、阴影以及九宫格位置，并内置了多种预设样式，所有调整都可以通过所见即所得的实时预览来确认。

全新任务式界面

在界面设计上，SmartSub 3.0 采用了全新的任务式界面，以“您想做什么？”为起点的启动台将任务、字幕校对、视频合成、引擎与模型、翻译服务等功能分区清晰呈现。软件内置了新手引导、命令面板（⌘K / Ctrl+K）以及下载与任务活动中心，降低了上手门槛。

批量处理与模型选择建议

SmartSub 支持批量处理，用户可以自定义并发任务数量，提高处理效率。在字幕生成过程中，还支持简繁转换、自定义字幕文件名，以及可选的中文字幕去标点功能，让烧录效果更加干净。对于 whisper 系列模型的选择，官方给出了参考建议：低端设备或核显推荐 tiny 或 base 模型；普通电脑可从 small 或 base 起步；高性能显卡或工作站推荐 large 系列；纯英文音视频建议选择带 en 的模型。如果模型文件下载困难，也可以通过国内镜像源或 Hugging Face 官方源手动下载后，在“引擎与模型”页面中导入。