案例:猫的二分类
数据集:train_catvnoncat.h5 、 test_catvnoncat.h5
逻辑回归、梯度下降
目录
1.使用h5py加载数据
2.查看数据信息 (以字典的方式提取)
3.提取图片以及标签(包含随机可视化一个样本)
4. 前向传播
5. 优化部分(梯度下降)
6. 预测、准确率
7. 不同学习率的比较
与之前作业的比较
1、使用 h5py 来读取图像文件,每一个图像为 28*28 像素,每一个像素作为一个特征,要把 四维的数组(209, 64, 64, 3),预处理为二维数组(12288,209)
2、机器学习中,我们用pandas读取数据时,每一行为一个样本(m,n),现在每一行为一个特征(n,m),以便对应公式 w.T @ X + b
3、(把损失函数、梯度下降、预测函数 整合到 一个模型中,便于保存),我看了一些大神的作业确实是那么做的,但实际上,我并没有做。
import h5py
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
1.使用h5py加载数据
data_train = h5py.File('train_catvnoncat.h5', 'r')
data_test = h5py.File('test_catvnoncat.h5', 'r')
2.查看数据信息
for key in data_train.keys():
print(data_train[key].name) # 打印每一个 key 的名字
# print(data_train[key].shape)
# print(data_train[key].value)
/list_classes
/train_set_x
/train_set_y
for key in data_test.keys():
print(data_test[key].name) # 打印每一个 key 的名字
# print(data_train[key].shape)
# print(data_train[key].value)
/list_classes
/test_set_x
/test_set_y
3.提取图片以及标签
3.1 提取训练集数据,并转化为np二维数组
x_train = data_train['train_set_x']
# 可视化一个样本
num = np.random.randint(209)
plt.imshow(x_train[num,:])
# print(type(x_train)) # <class 'h5py._hl.dataset.Dataset'> # 原始的维数 (209, 64, 64, 3)
x_train = np.array(x_train).reshape((209,-1)).T
# type(x_train) # numpy.ndarray
y_train = np.array(data_train['train_set_y'])
y_train = y_train.reshape((-1,1)).T
print(x_train.shape,