最近在做字体项目的数据集,处理时发现有的图片有黑块如图
而正常的图片是没有黑块的如下
手动筛选数据量太大了,就写了程序筛选。
中心思想就是遍历文件夹,然后逐列检测,遇到某一列像素大于等于黑块的高度就判断其有黑块,并输出“有黑块”
使用简单的opencv和python就能完成
程序非常简单,但是编写时遇到困难,在于读取单张图片时运行非常顺利,但是在遍历文件夹时却抛出错误
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()