飞桨领航团深度学习速成营学习记录

最新推荐文章于 2023-10-26 17:32:02 发布

Berlin.cpp คิดถึง

最新推荐文章于 2023-10-26 17:32:02 发布

阅读量373

点赞数 1

文章标签： python 机器学习深度学习图像识别

本文链接：https://blog.csdn.net/Berlinnnn/article/details/114682053

版权

本文详细记录了使用飞桨领航团深度学习速成营的四个作业，涵盖图像增广、手写数字识别、蝴蝶图像分类和柠檬分类实战。通过图像缩放、翻转、旋转、亮度调节、随机裁剪等增广技术处理数据，使用多层感知器进行手写数字识别，对蝴蝶图像进行分类，最后进行柠檬分类的调优工作。

摘要由CSDN通过智能技术生成

第一课作业 - 简单图像增广

常用图像增广方法主要有：左右翻转(上下翻转对于许多目标并不常用)，随机裁剪，变换颜色(亮度，对比度，饱和度和色调)等等，我们拟用opencv-python实现部分数据增强方法。

结构如下：

class FunctionClass:
    def __init__(self, parameter):
        self.parameter=parameter

    def __call__(self, img):

作业要求

1.补全代码
2.验证增强效果
3.可自选实现其他增强效果

import cv2
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline

filename = '1.jpg'
## [Load an image from a file]
img = cv2.imread(filename)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img)

图1 原始图像

print(img.shape)

(350, 350, 3)

1. 图片缩放

class Resize:
    def __init__(self, size):
        self.size=size

    def __call__(self, img):
        # 此处插入代码
        return cv2.resize(img,self.size)


resize=Resize( (600, 600))
img2=resize(img)
plt.imshow(img2)

在这里插入图片描述

2. 图片翻转

class Flip:
    def __init__(self, mode):
        self.mode=mode

    def __call__(self, img):
        # 此处插入代码
        return cv2.flip(img, self.mode)


flip=Flip(mode=0)
img2=flip(img)
plt.imshow(img2)

在这里插入图片描述

3. 图片旋转

class Rotate:
    def __init__(self, degree,size):
        self.degree=degree
        self.size=size

    def __call__(self, img):

        # 此处插入代码
        rows, cols,x = img.shape
        M = cv2.getRotationMatrix2D(((cols - 1) / 2.0, (rows - 1) / 2.0), self.degree, self.size)
        return cv2.warpAffine(img, M, (cols, rows))


rotate=Rotate( 45, 0.7)
img2=rotate(img)
plt.imshow(img2)

在这里插入图片描述

4. 图片亮度调节

class Brightness:
    def __init__(self,brightness_factor):
        self.brightness_factor=brightness_factor

    def __call__(self, img):

        # 此处插入代码
        rows, cols, x = img.shape
        a = 1
        blank = np.zeros([rows, cols, x], img.dtype)
        return cv2.addWeighted(img, a, blank, 1-a, self.brightness_factor * 100)
        

brightness=Brightness(0.6)
img2=brightness(img)
plt.imshow(img2)

在这里插入图片描述

5. 图片随机裁剪

import random
import math

class RandomErasing(object):
    def __init__(self, EPSILON=0.5, sl=0.02, sh=0.4, r1=0.3,
                 mean=[0., 0., 0.]):
        self.EPSILON = EPSILON
        self.mean = mean
        self.sl = sl
        self.sh = sh
        self.r1 = r1

    def __call__(self, img):
        if random.uniform(0, 1) > self.EPSILON:
            return img

        for attempt in range(100):
            area = img.shape[0] * img.shape[1]

            target_area = random.uniform(self.sl, self.sh) * area
            aspect_ratio = random.uniform(self.r1, 1 / self.r1)

            h = int(round(math.sqrt(target_area * aspect_ratio)))
            w = int(round(math.sqrt(target_area / aspect_ratio)))

            
            # 此处插入代码
        if w < img.shape[0] and h < img.shape[1]:
            x1 = random.randint(0, img.shape[1] - h)
            y1 = random.randint(0, img.shape[0] - w)
            if img.shape[2] == 3:
                img[ x1:x1 + h, y1:y1 + w, 0] = self.mean[0]
                img[ x1:x1 + h, y1:y1 + w, 1] = self.mean[1]
                img[ x1:x1 + h, y1:y1 + w, 2] = self.mean[2]
            else:
                img[x1:x1 + h, y1:y1 + w,0] = self.mean[0]
            return img

        return img


erase = RandomErasing()
img2=erase(img)
0]
            return img

        return img


erase = RandomErasing()
img2=erase(img)
plt.imshow(img2)

在这里插入图片描述

第二课作业 - 手写数字识别

作业要求

1.补全网络代码，并运行手写数字识别项目。以出现最后的图片和预测结果为准。（65分）
2.保留原本的multilayer_perceptron网络定义（自己补全完的），自己定义一个卷积网络并运行成功。以出现最后的图片和预测结果为准。（45分）

首先导入必要的包
numpy---------->python第三方库，用于进行科学计算
PIL------------> Python Image Library,python第三方图像处理库
matplotlib----->python的绘图库 pyplot:matplotlib的绘图框架
os------------->提供了丰富的方法来处理文件和目录

#导入需要的包
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import os
import paddle
print("本教程基于Paddle的版本号为："+paddle.__version__)

本教程基于Paddle的版本号为：2.0.0

1. 准备数据

(1)数据集介绍

MNIST数据集包含60000个训练集和10000测试数据集。分为图片和标签，图片是28*28的像素矩阵，标签为0~9共10个数字。

在这里插入图片描述

(2)transform函数是定义了一个归一化标准化的标准

(3)train_dataset和test_dataset

paddle.vision.datasets.MNIST()中的mode='train’和mode='test’分别用于获取mnist训练集和测试集

transform=transform参数则为归一化标准

#导入数据集Compose的作用是将用于数据集预处理的接口以列表的方式进行组合。
#导入数据集Normalize的作用是图像归一化处理，支持两种方式： 1. 用统一的均值和标准差值对图像的每个通道进行归一化处理； 2. 对每个通道指定不同的均值和标准差值进行归一化处理。
from paddle.vision.transforms import Compose, Normalize
transform = Compose([Normalize(mean=[127.5],std=[127.5],data_format='CHW')])
# 使用transform对数据集做归一化
print('下载并加载训练数据')
train_dataset = paddle.vision.datasets.MNIST(mode='train', transform=transform)
test_dataset = paddle.vision.datasets.MNIST(mode='test', transform=transform)
print('加载完成')