大数据扫黄,是怎样发现你的?

45cbdef115e30bc04a744b9d3b7fabc6.gif92178d9c27b8cd5d49683cec0df1d401.jpeg

72f22afb3606bda2c32ab3bf0afe1986.jpeg

cf7a0ce394d2296ad6fb14533d0d0251.jpeg

5620f2afeb51bb78fb490ff65de38c43.jpeg

7136676726d61ab52a8549c6f066f7b3.jpeg

6f13c5683713add1e920e78b4204a35c.jpeg

扩展阅读

在诸多审查工具中,“AI 鉴黄”是最新也最高效的一种。

简单来说,“AI 鉴黄”就是通过深度神经网络,按照各种描述特征来提取图像中的关键点,比如是否出现皮肤裸露等等,将色情图片与正常图片进行分类。

读到这里,大家可能会发现,“AI 鉴黄”还存在一些严峻的挑战,比如:

1.色情图像和正常图像有很多相似之处,判断非常复杂。游泳、比基尼等图片中同样也有大量裸露皮肤,被错误地归类为色情并删除,很可能影响用户网上冲浪的体验。

2.判断色情的标准不同。法官斯图尔特曾有句名言,我无法定义色情,但当我看到它时,我就知道了。对色情内容的监测也有一定的主观性,AI 往往会根据特征对裸露身体的大卫塑像而“痛下杀手”,却对部分软色情轻松放过。

3.依赖训练数据带来的风险。那么,是不是给 AI 尽可能多地语料就能帮助它提升识别的准确率呢?答案也不行。基于深度学习的黑箱性,攻击者如果知道 AI 鉴黄是根据哪些数据训练出来的,就可以有针对性地攻击、对抗这个模型,使其很快失效。

这也是为什么,人工鉴黄师,即人类审查员,依然还需要兢兢业业地在岗位上为冲浪护航。

                                           End

麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:
 
 
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

管理员二维码:
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值