首页 服务器租用 小白工具箱 社区 免费注册

AI硬字幕擦除工具

AI开源项目 AI开源项目AI消除去除字幕字幕擦除
AI硬字幕擦除工具
资源说明

基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现。

Video-subtitle-remover (VSR) 是一款基于AI技术,将视频中的硬字幕去除的软件。 主要实现了以下功能:

无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件

通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除)

支持自定义字幕位置,仅去除定义位置中的字幕(传入位置)

支持全视频自动去除所有文本(不传入位置)

支持多选图片批量去除水印文本

Windows GPU版本 v1.1.0(GPU):

百度网盘:https://pan.baidu.com/s/1fI7n5U-HzjcPg83Nhijvyg?pwd=MQTK 提取码:MQTK

仅供具有Nvidia显卡的用户使用(AMD的显卡不行)

效果演示

配置要求

无 Nvidia(英伟达)显卡请勿使用本项目,不支持AMD显卡!

最低配置:

GPU:GTX 1060或以上显卡

CPU:支持 AVX 指令集

使用教程

第一步:下载并解压压缩包,进入文件夹并找到启动程序的图标,双击打开

解压后直接进入文件内,找到名称为 启动程序.exe 的文件,双击直接运行。如果出现错误或者无法运行:
1、检查文件解压路径,不要有中文或者特殊符号;2、双击下面的 使用兼容模式运行.cmd 进行运行;3、可能是您的电脑配置不满足程序要求,建议检查上面的配置要求信息是否满足,或者换台电脑尝试。4、首次启动可能时间略长,请耐心等待!

第二步:打开之后,点击 Open,选择您需要处理的视频/图片打开导入程序

注意:导入的视频,可能会出现画面被拉伸变形的情况,这只是程序预览窗口的显示问题,不会影响最终输出的画面,正常使用即可

第三步:手动调整窗口中的四个滑块(分别对应绿框的四条边位置),将画面中的绿色边框调整到一个合适的位置,将需要擦除字幕的部分框入其中。

提示:默认显示的是视频中的第一帧,可以拖动画面下的滑块调整时间线位置,将画面停留在有字幕的那一帧,再调整对应的擦除框位置。

第四步:调整好合适的位置之后,点击左下角的Run,开始运行程序,同时,窗口中将实时显示画面处理效果(左边的是原始画面,右边的是AI擦除处理后的画面)

也可以直接将滑块拖到最大,将整个视频画面全部选中,对于多字幕画面,或者复杂画面处理效果不好的,这种方式处理出来的效果可能会更好!!

第五步:处理后的视频会保存在程序目录 .\vsr_windows_gpu_v1.1.0\vsr\resources\test 文件夹下,文件名后缀带有 _no_sub 的就是去除字幕后的文件。

常见问题

1、提取速度慢怎么办

修改程序文件 .\vsr\resources\backend\config.py 中的参数,可以大幅度提高去除速度

按照路径找到对应的文件,右键用记事本打开,然后可以使用 Ctrl+F 查找参数关键词修改参数。

MODE = InpaintMode.STTN # 设置为STTN算法

STTN_SKIP_DETECTION = True # 跳过字幕检测,跳过后可能会导致要去除的字幕遗漏或者误伤不需要去除字幕的视频帧

python

103 Bytes

© 莫卿 - TikTok跨境社区

2、视频去除效果不好怎么办

修改 .\vsr\resources\backend\config.py 中的参数,尝试不同的去除算法,算法介绍

InpaintMode.STTN 算法:对于真人视频效果较好,速度快,可以跳过字幕检测

InpaintMode.LAMA 算法:对于图片效果最好,对动画类视频效果好,速度一般,不可以跳过字幕检测

InpaintMode.PROPAINTER 算法: 需要消耗大量显存,速度较慢,对运动非常剧烈的视频效果较好

使用STTN算法

MODE = InpaintMode.STTN # 设置为STTN算法

# 相邻帧数, 调大会增加显存占用,效果变好

STTN_NEIGHBOR_STRIDE = 10

# 参考帧长度, 调大会增加显存占用,效果变好

STTN_REFERENCE_LENGTH = 10

# 设置STTN算法最大同时处理的帧数量,设置越大速度越慢,但效果越好

# 要保证STTN_MAX_LOAD_NUM大于STTN_NEIGHBOR_STRIDE和STTN_REFERENCE_LENGTH

STTN_MAX_LOAD_NUM = 30

python

262 Bytes

© 莫卿 - TikTok跨境社区

使用LAMA算法

MODE = InpaintMode.LAMA # 设置为STTN算法

LAMA_SUPER_FAST = False # 保证效果

python

68 Bytes

© 莫卿 - TikTok跨境社区

如果对模型去字幕的效果不满意,可以查看design文件夹里面的训练方法,利用backend/tools/train里面的代码进行训练,然后将训练的模型替换旧模型即可

3、CondaHTTPError

将项目中的.condarc放在用户目录下(C:/Users/<你的用户名>),如果用户目录已经存在该文件则覆盖

解决方案:https://zhuanlan.zhihu.com/p/260034241

4、4090 使用cuda 11.7跑不起来

解决方案:改用 cuda 11.8

相关资源
AI影视解说
AI影视解说
NarratoAI 是一款基于大语言模型的开源视频创作工具,只需上传视频,就能自动生成解说文案、剪辑视频、配音并添加字幕,一站式完成影视解说视频制作。该工具支持 GPT-4、Gemini、DeepSeek、Qwen 等多种 AI 模型,可接入 OpenAI、SiliconFlow、OpenRouter 等网关服务,内置多种配音模式,并支持 IndexTTS 语音克隆功能,让配音更加自然逼真。NarratoAI 部署简单,支持 Docker 和 Windows 整合包,配置要求低,4核CPU、8G内存即可运行,显卡非必须,剪辑10分钟视频成本仅约0.1元,非常适合需要批量生产视频的内容创作者。
AI开源项目影视解说短视频
AI视频音效配音
AI视频音效配音
该工具可根据输入的视频和文本,自动生成与之同步的高质量音频。用户上传无声视频后,系统会智能分析画面内容——人物动作、物体运动、场景环境等,生成时间同步、逻辑匹配的音效或背景音乐。支持视频转音频、文本转音频、图文联合引导三种生成模式。技术层面采用多模态联合训练框架,通过条件同步模块确保音画精确对齐,生成 8 秒音频仅需 1.23 秒,模型最小仅 157M 参数,在音频质量和同步性方面达到开源最高水平。完全免费,支持命令行和 Gradio 界面,可用于为 AI 视频配音、游戏音效制作、影视音轨生成等场景。
AI开源项目AI视频配乐AI视频配音
AI超分辨率工具
AI超分辨率工具
图像修复领域最受欢迎的开源项目之一。该工具的核心功能是将低分辨率、模糊的图像提升为高清图像。与传统算法假设的理想下采样不同,RealESRGAN 专门针对现实世界中复杂多样的图像退化进行训练,能够处理模糊、噪点、JPEG 压缩伪影等多种退化问题。无论是老照片修复、动漫图片增强还是视频画质提升,都能获得出色的效果。RealESRGAN 基于 GAN 架构,主要创新包括高阶退化建模、sinc 滤波器抑制振铃伪影、频谱归一化 U-Net 判别器等。提供多种预训练模型:通用模型、动漫专用模型、动漫视频模型等,还支持 GFPGAN 人脸增强。使用便捷,提供 Python 脚本、便携式可执行文件和在线 Demo 三种方式。便携版无需安装环境,下载后直接运行即可。广泛应用于老照片修复、短视频画质提升、动漫图片增强、游戏素材高清化等场景。
AI开源项目AI超分画质修补
AI一键生成高清短视频
AI一键生成高清短视频
输入视频主题或关键词,全自动生成文案、素材、字幕、背景音乐并合成高清短视频。
AI开源项目短视频视频生成
AI文字转语音TTS
AI文字转语音TTS
Kokoro TTS 是目前最受关注的开源文本转语音项目,基于 hexgrad 开发的 Kokoro-82M 模型该模型仅用 8200 万参数就能实现接近真人的语音效果,生成的英语发音自然流畅、情感丰富,Apache 2.0 开源许可证,完全免费可商用。支持 28 种音色,涵盖美式英语、英式英语、中文、法语、意大利语、日语等多种语言,还可通过 Voice Blending 功能混合多个音色创造独特声音。支持 TXT、PDF、EPUB 等多种输入格式,可直接朗读整本书籍。提供 CLI 命令行和 Gradio 网页界面,语速可在 0.1-3.0 倍之间调节。安装便捷,支持 pip、uv 安装和 Windows 一键启动整合包。广泛应用于 AI 视频配音、有声书制作、播客内容创作等场景,已成为众多 AI 视频工具的首选配音方案。
AI开源项目AI朗读AI视频配音
金牌服务
外贸独立站
外贸独立站
让世界见证您的好产品,告别平台抽成,开启品牌出海新篇~
建站独立站外贸多语言中英文网站
安卓App开发
安卓App开发
从0到1交付安卓应用:原型设计、UI、客户端开发、后端接口、消息推送、支付登录、上架与运维。你只管业务,我们负责把产品落地。
安卓APP开发
脚本定制
脚本定制
专门配置硬件、安装运行环境并部署定制化脚本(如数据采集、自动化运维、游戏多开等脚本)的服务器,让你无需自己搭建和维护环境,即买即用。
脚本运维定制
TG机器人开发
TG机器人开发
开发自动回复、群管、通知推送或交易工具等功能的机器人程序,并负责部署和维护的技术服务。
自动化机器人定制开发消息推送