如何批量识别图片或者视频中的人脸或人身体部位后批量应用高斯模糊?
如何批量识别图片或者视频中的人脸或人身体部位后批量应用高斯模糊?
由于我的站点是放在国内服务器上,上次被封是24年的5月份,我不知道是同行举报,还是腾讯云有监测机制,会扫描你网站的内容,然后分发到人工审核,最终我的站点5月份的时候,就被腾讯以整改为由下架了,我当时非常的气愤,但是后续由于出搞了很多线下门徒的课程,也受限于当时还没有想到更好的折衷的模式,所以站点就始终没有上线,所有的kubernetes课程录制和一些即将上线功能的开发,也都是在本地虚拟机集群环境里进行,直到这次我把站点重新上线。
这站点无论是各个部分,其实都大量应用了人工智能(比如说很多视频的生成,完成是依赖于我基于so-vits-svc训练出我自己的声音,又基于sd-wav2lop-uhq做个基于短视频到长视频的面部生成加对口型),比如说数据采集,这里面很多文章都是从国外的一些资深的情感博客用rod类型的golang爬虫做了数据采集,鉴于colly只针对于静态url地址有效,而很多国外的站点其实都是自己写的框架,或者用drupal这种重炮手,或者是wordpress加了很多防爬技术,所以用常规方式(python的scrapy,puppeteer也不错,但是重度写javascript,playwright selenium都是python系,现在除非写人工智能小工具相关)很难搞定这些有着复杂交互的网站,所以我就用了golang系的一些框架搞了这些爬虫,主要就关注在并发性能高,而且可以有很多hack的操作,而且文章摘回来普通的翻译方式语感上差太多了,肯定要人工介入的,我现在还在想着更加chatgpt的方式来做这件事,但是总之,普普通通的站点后面,其实细枝末节,都彰显着与时代同行的显著特征。回到正题,后面就想到了这个方式,你不放图片,文章可读性低,至少我这么感觉!
你想吧,你小程序打开一篇文章,通篇一张图没有,无聊的很!但是放图吧,我不知道为啥我的自媒体运感觉不太行,因为我油管已经被封五次了,同样是劲爆的做搭讪约会女生得吃操作这些,我不知道为啥被封的总是我!害,说来话长,我很早时候,用python生成了2000多个视频,瞬间就过了国内西瓜平台的收益门槛,当时还写了文章庆祝,移步这里:4天23000流量成功开通中视频计划视频剪辑挣钱不寒碜附送puppeteer技术清单助力全自动化视频剪辑,只可惜后面人工审核,不断的空洞提示,审核不通过,我心灰意冷,于是转战油管,第一个账号很快就过2000订阅和播放时长,但是很快频道就被整体移除了,很复杂,有机会我把我几次频道被封的前因后果,用视频形式分享出来!前前后后被移除了四五个频道,真的很心痛!歪楼了,回到正题,于是我把图片整体应用上高斯模糊,你反正能知道这里有个图片,但是又没有实际全景的展示,应该也不容易落人口实,于是说干就干!
针对于给图片或者视频加马赛克,现在比较成形的方案就是加遮罩层,属于简单的部分,复杂的部分在于人脸识别。但是yovov3,yovov5的横空出世,这也不再是问题,我遍寻国外相关文章,其实yovov5做人脸识别上,应该已经达到登峰造极,后面迭代的版本,解决的不再聚集于人脸识别上了,所以我先是用yovov5做试验,但是效果可以说是没有,可能一些配置参数的原因,总之,并没有很好的检测,我大概几万张图片放进去做测试,几乎都无法正确识别面部,可能还需要再仔细阅读文档!由于我本地的cuda是11.8的版本,其实现在nvidia现在的cuda版本已经12+了,所以我感觉可能是版本兼容性的问题,于是我又读了下yovov3的文档,打算用这个尝试一下,看能否有进展,不试不知道,一试吓一跳,效果非常好,但是对于极刁钻角度的侧脸,还是有漏识现象,但是问题不大,同时我又加强了它的功能,毕竟我文章里的图片,似乎身体部分也应该做遮挡,毕竟,真的怕又被标记成搞黄,就很烦!
最后放几张图,大家感受下!
源码我会放在我的知识星球!