一.项目描述
数据集来源于kaggle猫狗大战数据集。训练集有25000张,猫狗各占一半。测试集12500张。希望计算机可以从这些训练集图片中学习到猫狗的特征,从而使得计算机可以正确的对未曾见过的猫狗图片进行分类。这就是图像分类问题,计算机视觉研究领域之一,计算机通过学习图像本身的特征将不同类别的图像区分开来。
二.评价指标
二分类评价指标
binary_crossentropy:交叉熵
ŷ i是样本标签,yi样本输出。只有yi和ŷ i是相等时,loss才为0,否则loss就是为一个正数。而且,概率相差越大,loss就越大。这个度量概率距离的方式称为交叉熵。
二分类模型的最后一层的激活函数 是:sigmoid
二分类模型最后输出的是0到1的数。
应该使用numpy的四舍五入求取类别,并转换为整数
pred_y=int(np.round(predict_y))
多分类评价指标
categorical_crossentropy:分类交叉熵函数
ŷ i是样本标签,yi样本输出
多分类模型的最后一层的激活函数 是:softmax
softmax先把输出指数化,再归一化,得到各类概率。
假设一个问题是3分类,一个训练样本进来得到的softmax是[0.5,0.2,0.3]
假设这个正确样本类别为第一个类别。
则该样本分类交叉熵为:
多分类模型输出的是各个类别的概率,如2个样本的预测输出为:ypred=[[0.5,0.2,0.3],[0.4,0.1,0.5]]
应该使用numpy求取最大值索引
pred=np.argmax(ypred,axis=1)
得到[0,2]
三.算例实现
数据集
电脑垃圾啦,无法将全部图片都用上,跑不动。
于是猫和狗都选取原始数据集的一半左右。
猫的图片如下:
狗的图片如下:
各种各样的猫和狗,不容易找到统一的图片预处理方式,如处理成二值图像(但猫狗颜色不一样,二值处理有的把背景提取出来啦,毕竟二值处理需要把前景色处理成白色,为了达到此要求,有的图片得做反二值化处理)
就对图片不做任何处理吧,防止图片失真。
1数据集读取函数
注意:cv2.imread(name) 图片路径不能含有中文。
#个人喜好用OpenCV
需要对图片统一大小: cv2.resize(img, (100, 100))
import os
import numpy as np
import cv2
def ReFileName(dirPath):
"""<