这次是通过图片文件内容的对比来删除相同的图片,为了有一个对比的方式,我先生成了网页,在网页中进行一个浏览,然后再打开删除语句,进行删除。效果如下:
就是这样网页效果比较粗糙,但能产生需要的效果。浏览完了就可以打开删除语句了。
代码如下:
import os
import hashlib
DirList = [
'/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/drawings',
'/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/hentai',
'/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/neutral',
'/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/porn',
'/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/sexy'
]
def getMD5(file, readLen = 1024*20):
md5code = hashlib.md5()
with open(file, 'rb') as f:
data = f.read()
# *******