python 少儿不宜图片识别(基于肤色数量)

利用python判断之前爬取的图片是否为少儿不宜。

参考博客:

https://blog.csdn.net/gzlaiyonghao/article/details/3166735

https://blog.csdn.net/dawnstar_hoo/article/details/4043837

https://blog.csdn.net/oxuzhenyi/article/details/55000520

思路:

一、打开图片,转换为YCbCr 格式,

二、根据 cb 、 cr 值判断当前像素是否为皮肤

三、计算图片中皮肤所占的像素数量。如果该数量超过图片总像素的30%,则判断为色情图片

结论:

1、算法比较简单,容易实现。

2、如果是纯色情图片,这个算法识别率较高

3、如果穿有一定数量的衣服干扰,或者人物在图片中占比较小,误判率较高

4、大头照容易误判

5、没有判断图片是否是人还是动物

6、图片像素大于10万时速度较慢,最好先缩放一下



##coding=utf-8
#根据肤色数量判断
from PIL import Image
basedir=r'D:\Python\PycharmProjects\nudedetection\imag2'
import os
for filename in os.listdir(basedir):
    full_filename=os.path.join(basedir,filename)
    img = Image.open(full_filename).convert('YCbCr')
    w, h = img.size
    data = img.getdata()
    cnt = 0
    for i, ycbcr in enumerate(data):
        y, cb, cr = ycbcr
        if 86 <= cb <= 117 and 140 <= cr <= 168:
            cnt += 1
    print '%s is a porn image?:%s.'%(filename, 'Yes' if cnt > w * h * 0.3 else 'No')

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值