Mvtec数据集批量加各种噪声（高斯，椒盐，随机噪声）

最新推荐文章于 2024-06-06 11:14:17 发布

双木什么来着？

最新推荐文章于 2024-06-06 11:14:17 发布

阅读量1.2k

点赞数

文章标签： python list

本文链接：https://blog.csdn.net/weixin_44967646/article/details/123944538

版权

最近想在Mvtec数据集test数据中加一些噪声，参考别人的博客写了一个代码，可以对数据集批量处理（这里只对test数据进行了噪声处理），代码如下：

import cv2
import numpy as np
import os
import random

#   随机噪声
def random_noise(image,noise_num):
    '''
    添加随机噪点（实际上就是随机在图像上将像素点的灰度值变为255即白色）
    param image: 需要加噪的图片
    param noise_num: 添加的噪音点数目
    return: img_noise
    '''
    # 参数image：，noise_num：
    img_noise = image
    # cv2.imshow("src", img)
    rows, cols, chn = img_noise.shape
    # 加噪声
    for i in range(noise_num):
        x = np.random.randint(0, rows)#随机生成指定范围的整数
        y = np.random.randint(0, cols)
        img_noise[x, y, :] = 255
    return img_noise



#  椒盐噪声
def sp_noise(noise_img, proportion):
    '''
    添加椒盐噪声
    proportion的值表示加入噪声的量，可根据需要自行调整
    return: img_noise
    '''
    height, width = noise_img.shape[0], noise_img.shape[1]#获取高度宽度像素值
    num = int(height * width * proportion) #一个准备加入多少噪声小点
    for i in range(num):
        w = random.randint(0, width - 1)
        h = random.randint(0, height - 1)
        if random.randint(0, 1) == 0:
            noise_img[h, w] = 0
        else:
            noise_img[h, w] = 255
    return noise_img


# 高斯噪声
def gaussian_noise(img, mean, sigma):
    '''
    此函数用将产生的高斯噪声加到图片上
    传入:
        img   :  原图
        mean  :  均值
        sigma :  标准差
    返回:
        gaussian_out : 噪声处理后的图片
    '''
    # 将图片灰度标准化
    img = img / 255
    # 产生高斯 noise
    noise = np.random.normal(mean, sigma, img.shape)
    # 将噪声和图片叠加
    gaussian_out = img + noise
    # 将超过 1 的置 1，低于 0 的置 0
    gaussian_out = np.clip(gaussian_out, 0, 1)
    # 将图片灰度范围的恢复为 0-255
    gaussian_out = np.uint8(gaussian_out*255)
    # 将噪声范围搞为 0-255
    # noise = np.uint8(noise*255)
    return gaussian_out# 这里也会返回噪声，注意返回值


# 读取并保存
def convert(input_dir, output_dir):
    for filename in os.listdir(input_dir):
        path = input_dir + "/" + filename # 获取文件路径
        print("doing... ", path)
        noise_img = cv2.imread(path)#读取图片
        # img_noise = gaussian_noise(noise_img, 0, 0.3) # 高斯噪声
        #img_noise = sp_noise(noise_img, 0.01)  # 椒盐噪声
        img_noise  = random_noise(noise_img,3000)# 随机噪声
        cv2.imwrite(output_dir+'/'+filename,img_noise )


# mvtec中所有的类别
CLASS_NAMES = ['bottle', 'cable', 'capsule', 'carpet', 'grid',
               'hazelnut', 'leather', 'metal_nut', 'pill', 'screw',
               'tile', 'toothbrush', 'transistor', 'wood', 'zipper'] 

data_path = "E:\mvtec_noise\\mvtec_random_noise_3000"  # 数据集路径
if __name__ == '__main__':

    for class_name in CLASS_NAMES:
       os_path_class = os.listdir(os.path.join(data_path, class_name, "test"))  # 读取文件夹下的所有文件名（test数据集里还有各种类别，这里是为了获取test中所有类别的名称）
       for name in os_path_class:
         input_dir = os.path.join(data_path, class_name, "test", name)    # 输入数据文件夹
         output_dir = os.path.join(data_path, class_name, "test", name)  # 输出数据文件夹（会覆盖原图）
         convert(input_dir, output_dir)