吴恩达机器学习CS229A_EX3_LR与NN手写数字识别_Python3

最新推荐文章于 2024-06-07 22:46:47 发布

AI_Study

最新推荐文章于 2024-06-07 22:46:47 发布

阅读量610

点赞数

分类专栏：机器学习实战

本文链接：https://blog.csdn.net/AI_lalaland/article/details/105687461

版权

这篇博客介绍了使用逻辑回归和神经网络对手写数字进行多分类识别的问题。首先，通过逻辑回归进行预处理和模型建立，并实现分类和测试功能。结果显示在未使用正则化的情况下，逻辑回归表现良好。然后，搭建了神经网络模型，其结构包括输入层、隐藏层和输出层，最终得到97.52%的正确率。此外，尝试可视化隐藏层，但未能发现明显模式。

摘要由CSDN通过智能技术生成

任务描述

数据集为手写数字，是一个多分类问题，分别用逻辑回归和神经网络做。

逻辑回归

逻辑回归及其正则化已经在 EX 2 做过，这里做一些修改即可。

首先导入数据，给出的数据集是 Matlab 的 .mat 格式，每个样本是 20 * 20 的灰度图，共 5000 个样本：

import numpy as np
from scipy.io import loadmat
import scipy.optimize as opt

def loadData(filename):
    return loadmat(filename)

data = loadmat('ex3data1.mat')
print(data['X'].shape, data['y'].shape)

(5000, 400) (5000, 1)

Process finished with exit code 0

接着对数据预处理，因为是数字 0 ～ 9 的多分类问题，需要 10 个分类器，这里 theta 初始化为大小为 11 * n+1 的数组，11 是因为数字 0 的标签是 10，这样后续程序写起来比较简洁。

def initData(data):
    # 样本数
    m = data['X'].shape[0]
    # 特征数
    n = data['X'].shape[1]
    # 增加一列 bias
    data['X'] = np.append(data['X'], np.ones(m).reshape(m,1), axis=1)
    X = data['X']
    y = data['y']
    theta = np.zeros((11, n + 1))
    return X, y, theta

编写 Logistic Regression 需要的函数，详细内容可参考：吴恩达机器学习CS229A_EX2_逻辑回归与正则化。

这里根据要求对梯度求解函数做了改写，用矩阵运算替代循环，函数的计算结果和之前的是一样的。

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def costReg(theta, X, y, lamda):
    n = len(theta)
    m = len(y)
    first = -y * np.log(sigmoid(X @ theta.reshape(n,1)))
    second = -(1 - y) * np.log(1 - sigmoid(X @ theta.reshape(n,1)))
    reg = (lamda / (2 * m)) * np.sum(np.power(theta.reshape(n,1), 2))
    return (sum(first + second) / m) + reg

def gradientReg_noLoop(theta, X, y, lamda):
    n = len(theta)
    m = len(y)
    error = sigmoid(X @ theta.reshape(n, 1)) - y
    grad = (X.T @ error / m) + ((lamda / m) * theta.reshape(n, 1))
    grad[0][0] = np.sum(error * X[:, 0].reshape(m, 1)) / m
    grad = np.reshape(grad, (n,))
    return grad

编写分类函数和测试函数：

# 分类函数
def one_vs_all(theta, X, y, lamda):
    m = len(y)
    n = len(theta[0])
    # 从 1 到 10 总共训练 10 个分类器，依次保存到

最低0.47元/天解锁文章

AI_Study

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录