前言
需要提取的图像特征:
1.文件大小;2.宽;3.高;4.图片尺寸;5.图像梯度(表征图像纹理的复杂程度);6.sobel算子(表征图像复杂度);7.色彩丰富度;8.无参考图像评价指标NIQE。
最后根据上述图像信息可对相同的图片进行去重操作
代码
# *encoding=utf-8
import re
import os
import cv2
import math
import numpy as np
import pandas as pd
import skvideo.measure
# sobel算子
def SI_IMG(img):
sobelx = cv2.Sobel(img, cv2.CV_64F, dx=1, dy=0)
sobelx = cv2.convertScaleAbs(sobelx).astype('float32')
sobely = cv2.Sobel(img, cv2.CV_64F, dx=0, dy=1)
sobely = cv2.convertScaleAbs(sobely).astype('float32')
a = sobelx * sobelx + sobely * sobely
result = np.sqrt(a).astype('float32')
stddv = result