[学习笔记]matlab官方课程学习记录 https://matlabacademy.mathworks.com/cn
1 流程
1.1 加载并产看图像
使用 imread 函数来导入大多数标准文件格式(GIF、JPEG、PNG 等)的图像。
img1 = imread('file01.jpg');
imshow(img1)
1.2 使用 alexnet 函数在 MATLAB 工作区中创建预定义的深度网络“AlexNet”的副本
deepnet = alexnet;
1.3 预测类别
pred1 = classify(deepnet,img1)
2 CNN架构
2.1 图示
2.2 查看网络层
ly = deepnet.Layers
2.3 抽取第一层
inlayer = ly(1)
2.4 提取第一层的InputSize属性
insz = inlayer.InputSize
结果:
227 227 3
2.5 输出层
outlayer = ly(end)
2.6输出层的 Classes 属性给出了训练的网络可预测的类别名称
categorynames = outlayer.Classes
2.5 研究预测
2.5.1 分类函数
classify 函数默认输出网络打分最高的类。您可以使用 classify 的另一个输出参数来获得所有类的预测分数。
[pred,scores] = classify(net,img);
2.5.2 创建预测分数条形图
bar(scores)
highscores = scores > 0.01
bar(scores(highscores))
xticklabels(categorynames(highscores))
3 管理图像数据集合
3.1图像数据存储
3.1.1 创建数据存储
使用 imageDatastore 函数在 MATLAB 中创建一个数据存储,指定文件夹名称或文件名作为输入。您可以使用通配符(例如*)来指定多个文件。
imds = imageDatastore('file*.jpg')
3.1.2 数据存储的属性包含有关数据文件的元信息
fname = imds.Files
3.1.3 导入图像
使用 read、readimage 和 readall 函数从数据存储手动导入数据:read 按顺序一次导入一个图像;readimage 导入单个特定图像;readall 将所有图像导入一个元胞数组中(每个图像位于一个单独元胞中)。
img = readimage(imds,7); 数据存储中的第 7 个文件
img = 227*227*3 array
3.1.4 您可以在 CNN 函数(例如 classify)中使用图像数据存储来代替单个图像
preds = classify(net, imds)
结果将是一个预测类数组,数据存储中的每个图像对应一个预测类。
preds = 12*1 categorical
3.2 调整输入图像
3.2.1 查看大小
sz=size(img)
sz=1*3
1096 822 3
3.2.2 网络输入层指定图像大小
net = alexnet;
inlayer = net.Layers(1)
insz = inlayer.InputSize
insz = 1*3
227 22 3
3.2.3 调整图像大小
img = imresize(img,[227 227]);
imshow(img)
3.3 处理数据存储中的图像
ls *.jpg
3.3.1 创建增强的图像数据存储
net = alexnet
任务一:创建图像数据存储imds
imds = imageDatastore('file*.jpg')
任务二:增强的图像数据存储可以对整个集合图像执行简单的预处理。augmentedImageDatastore函数将网络的图像输入大小用作输入。将图像大小调整为[227 227]
auds = augmentedImageDatastore([227 227],imds)
任务三:您可以将增强的图像数据存储用作 classify 函数的输入。
preds = classify(net,auds)
3.3.2 利用增强的图像数据存储进行颜色预处理
任务一:使用函数 montage 显示数据存储 imds 中的图像
montage(imds)
任务二:基于图像数据存储 imds 创建一个增强的图像数据存储。将图像预处理为 227×227×3。
在创建增强的图像数据存储时,可以通过设置 ColorPreprocessing 选项将这些图像转换为三维数组。
auds = augmentedImageDatastore([227 227], imds, 'ColorPreprocessing', 'gray2rgb')
任务三:对auds中的图像进行分类
preds = classify(net,auds)
3.4 用子文件夹选项创建数据存储
默认情况下,imageDatastore 只在给定文件夹内查找图像文件。您可以使用 'IncludeSubfolders' 选项在给定文件夹的子文件夹中查找图像。
flwrds = imageDatastore('Flowers','IncludeSubfolders',true)
4 执行迁移学习
选择成熟的训练好的的模型,用有标记的训练数据,对模型进行微调,能够快速训练。
4.1 准备训练数据
4.1.1 标注图像
load pathToImages
flwrds = imageDatastore(pathToImages,'IncludeSubfolders',true);
#属性Labels存储数据标记,该数据没有标记flwrds = imageDatastore(pathToImages,'IncludeSubfolders',true,'LabelSource','foldernames')
#属性Labels存储数据标记,这里就是花的种类,参数设定了标记数据就是文件夹名flowernames = flwrds.Labels
4.1.2 拆分训练和测试数据
任务一:使用 splitEachLabel 函数将数据存储中的图像分成两个单独的数据存储
load pathToImages
flwrds = imageDatastore(pathToImages, 'IncludeSubfolders', true, 'LabelSource', 'foldernames')
[flwrTrain,flwrTest] = splitEachLabel(flwrds,0.6)
任务二:添加可选的 'randomized' 标志来实现随机乱序
添加可选的 'randomized' 标志来实现随机乱序
[flwrTrain, flwrTest] = splitEachLabel(flwrds, 0.8, "randomized")
任务三:设置每个类别的固定数的样本
某些应用中,属于一个类的图像数量远超另一类的图像。例如,当尝试检测次品时,通常很容易获得许多非次品图像,而很难获得次品图像。在拆分数据时,最好使每个类的训练图像数量相同。当 p 是从 0 到 1 的值时,解释为比例。还可以指定每个标签的对应文件中要分配给 ds1 的确切数量。确保 ds1 中的每个标签都有 n 个图像。
4.1.3 增强的训练数据
例如augmentedImageDatastore
4.2 修改网络层
4.2.1 修改预训练网络的层
任务一:fullyConnectedLayer 函数使用给定数量的神经元创建一个新的全连接层。
anet = alexnet;
layers = anet.Layers
#使用 12 个神经元(针对 12 种花)创建一个新的全连接层 fc。
fc = fullyConnectedLayer(12)
任务二:用您刚刚创建的新层 fc 替换数组 layers 表示的网络的最后一个全连接层(第 23 个层)
layers(23) = fc
任务三:使用 classificationLayer 函数为图像分类网络创建一个新输出层
layers(end) = classificationLayer
4.3 设置训练选项
任务一:查看训练选项
可以设置哪些选项来控制网络训练?您可以使用 trainingOptions 函数来查看所选训练算法的可用选项。
opts = trainingOptions('sgdm')
这会创建一个变量 opts,其中包含“动量随机梯度下降”训练算法的默认选项。如图:
任务二:更改学习率
opts = trainingOptions('sgdm','InitialLearnRate',0.001)
4.4 执行训练
迁移学习三个条件:网络|训练数据|设置选项
4.4.1 小批量
最大轮数 MaxEpochs
最小批次 MiniBatchSize
训练期间报告的损失和准确度针对的是当前迭代中使用的小批量数据。
默认情况下,图像在分成小批量之前会进行一次乱序处理。您可以使用 Shuffle 选项来控制此行为。
4.4.2 GPU
GPU(图形处理单元)可以大大加快深度学习所需的大量计算。
如果您安装了适当的 GPU 和 Parallel Computing Toolbox,trainNetwork 函数可自动在 GPU 上执行训练,无需专门编码。
如果没有安装,训练将在计算机的 CPU 上进行。您可以体验过后再决定是否购买所需的硬件和软件。
4.5综合示例
迁移学习脚本示例
以下代码针对本章中的花卉物种示例实现迁移学习。课程示例文件中提供了该代码的脚本 trainflowers.mlx 。您可以从右上角的帮助菜单下载课程示例文件。牛津大学的 17 Category Flower Dataset 页面上提供了关于该数据集的更多信息。
获取训练图像
flower_ds = imageDatastore('Flowers', 'IncludeSubfolders', true, 'LabelSource', 'foldernames');
[trainImgs,testImgs] = splitEachLabel(flower_ds, 0.6);
numClasses = numel(categories(flower_ds.Labels));
通过修改 AlexNet 创建网络
net = alexnet;
layers = net.Layers;
layers(end-2) = fullyConnectedLayer(numClasses);
layers(end) = classificationLayer;
设置训练算法选项
options = trainingOptions('sgdm','InitialLearnRate', 0.001);
执行训练
[flowernet,info] = trainNetwork(trainImgs, layers, options);
#变量 info 是包含训练信息的结构体。
#变量 flowernet 包含使用 AlexNet 基于花卉物种数据执行迁移学习后所得的网络。使用经过训练的网络对测试图像进行分类
testpreds = classify(flowernet, testImgs);
4.6 评估性能
4.6.1 变量 info 是包含训练信息的结构体
TrainingLoss 和 TrainingAccuracy 字段包含网络在训练数据上进行每次迭代后达到的性能的记录。
plot(info.TrainingLoss)
4.6.2 使用 classify 函数获得 flowernet 对数据存储 testImgs 中图像的预测分类
dsflowers = imageDatastore(pathToImages,'IncludeSubfolders',true,'LabelSource','foldernames');
[trainImgs,testImgs] = splitEachLabel(dsflowers,0.98);flwrPreds = classify(flowernet, testImgs)
4.6.3 评估
load pathToImages.mat
pathToImages
flwrds = imageDatastore(pathToImages,'IncludeSubfolders',true,'LabelSource','foldernames');
[trainImgs,testImgs] = splitEachLabel(flwrds,0.98);
load trainedFlowerNetwork flwrPredslwrActual = testImgs.Labels;
numCorrect = nnz(flwrActual == flwrPreds)
confusionchart(testImgs.Labels, flwrPreds)