Skip to content
3 min read

Day 7 | 水印太碍眼?我随手写段代码,秒解 Sora2 视频水印

网站上线后主要功能页面太单薄?用户痛点小工具来丰富!

上效果:

白天带娃,晚上孩子睡着后开始了我的sora 2 视频水印解决的办法,在上一篇中我提到我调研了一堆工具后,发现没有一个工具去水印效果好,所以我做了一件事情,自己来尝试解决这个问题。我很快速的和ai的交互中写了一个flask的demo,随后把它集成到我的项目中去,很显然我写demo容易,做集成的时候却要考虑的比较多。

因为我的整个视频项目是基于nextjs的模版所以我需要对demo进行改写,我分成了两个部分,nextjs项目负责UI,flask api的部分被我修改成了fastapi, 这样可以提高些性能。划分好之后就开始进行处理。

期间我忽略了一个问题,我的fastapi的接口是直接暴露在了,公网中我在测试的时候发现,这个地址容易泄露,所以使用了nextjs 路由功能进行包转转发,这样就不会有这个泄漏接口的风险。

我想聊聊为什么我看到去水印的需求之后,首先是去找第三方去对接呢,因为我的确没有复杂的处理图像的经验,我不确定我能做好,所以我去搜索。那么我是如何搜索的呢,分享下我的秘密,我不是直接去谷歌搜索,也不是去chatgpt,我最直接的搜索是grok,我在最开始的时候做一个技术,我从grok中获得了灵感,所以面对技术难题的时候我会去让grok查x上有多少类似的人碰到这样的问题,他们提供了什么有没有开源的解决方案。这能确保我基本上获取到的是最新的。我尝试过直接使用ai技术作去除的就是wavespeed.ai 的还有其他的,会改变人脸,会有大段的模糊。

从别人那里得到思路后我看到了几个分阶段的,就是使用runway 在视频编辑其中去处理。很繁琐,完全不用人操作自动化的效果又很差,所以我找到一个折衷方案,那就是人工+算法。最开始ai给我写了一个版本的,根据sora2 视频的特性:水印循环:前 66 帧左上、中 80 帧右中、后 81 帧左下,这一个办法可以采取mark的方式处理,我进行了优化,对三个位置区域进行了每一帧的去除,并且算法自动识别环境进行补全所以最终效果还比较满意。

总结:我的深刻感受是AI真的在一定程度上带来了技术的平权,不会技术的可以使用ai来补全你的短板,所以技术不是问题了,那么把制造的东西卖出去,就是这个时代的核心能力了!!

关注我,一起出海,一起交流!!