手撸机器学习系列之 - 神经网络前向传播

本例是手写数字识别的一个案例,使用的是神经网路正向传播

首先加载库

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt

接着导入数据

data=sio.loadmat("ex3data1.mat")
type(data)
dict

可知 data 是一个 dict , 我们看下他有哪些东西

data.keys()
dict_keys(['__header__', '__version__', '__globals__', 'X', 'y'])

获取原始数据 raw_X 和 raw_y

raw_X=data['X']
raw_y=data['y']
raw_X.shape,raw_y.shape
((5000, 400), (5000, 1))

raw_y 是一个二维数组, 我们将其变为一维数组

y=raw_y.flatten()
y.shape
(5000,)

现在得到了 raw_X 和 y,为了方便,我们将其变为 X,y

X=raw_X
y=y
X.shape,y.shape
((5000, 400), (5000,))

接下来加载已经训练好的权重

theta = sio.loadmat('ex3weights.mat')
type(theta)
dict
# 查看其数据
theta.keys()
dict_keys(['__header__', '__version__', '__globals__', 'Theta1', 'Theta2'])
# 获取数据
theta1=theta['Theta1']
theta2=theta['Theta2']
theta1.shape,theta2.shape
((25, 401), (10, 26))
# 定义 sigmod
def sigmoid(z):
    return 1/(1+np.exp(-z))

神经网络是这样:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-b39HAxOg-1600692167001)(attachment:%E5%9B%BE%E7%89%87.png)]

# 先计算输入层. 输入层比较简单,就是原始数据
a1=X

接着计算隐藏层,隐藏层为 s i g m o i d ( X ∗ θ 1. T ) sigmoid(X*\theta1.T) sigmoid(Xθ1.T)

维度:
X: (5000, 400)
theta1: (25, 401)

在 X 的首列插入全 1

X=np.insert(raw_X,0,values=1,axis=1)
X.shape,theta1.shape
((5000, 401), (25, 401))
# 计算 a2
a2=sigmoid(X@theta1.T)
a2.shape,theta2.shape
((5000, 25), (10, 26))
# 接着计算 a3 输出
a2_t=np.insert(a2,0,values=0,axis=1)
a2_t.shape
(5000, 26)
a3=sigmoid(a2_t@theta2.T)
a3.shape
(5000, 10)
pre_res=np.argmax(a3,axis=1)+1
pre_res.shape
(5000,)
# 看下准确率
acc=[1 if a==b else 0 for (a,b) in zip(y,pre_res)]
acc=np.sum(acc)/len(y)
acc
0.976
fig,ax=plt.subplots(ncols=10,nrows=10,figsize=(10,10),sharex=True,sharey=True)
image_indexs=np.random.choice(len(raw_X),100)
images=raw_X[image_indexs,:]
# 配合 sharex=True,sharey=True 隐藏坐标
plt.xticks([])
plt.yticks([])
# 注意,0 = 10
for i in range(10):
    for j in range(10):
        f_index=i*10+j
        ax[i,j].imshow(images[f_index].reshape((20,20)).T)
#         pre_num[image_indexs[f_index]] 为图片的预测值
        ax[i,j].text(2, 4, pre_res[image_indexs[f_index]] , horizontalalignment='center',bbox=dict(facecolor='red', alpha=0.5))

png

把 a2 绘制出来看看

fig,ax=plt.subplots(ncols=10,nrows=10,figsize=(10,10),sharex=True,sharey=True)
image_indexs=np.random.choice(len(raw_X),100)
images=a2[image_indexs,:]
# 配合 sharex=True,sharey=True 隐藏坐标
plt.xticks([])
plt.yticks([])
# 注意,0 = 10
for i in range(10):
    for j in range(10):
        f_index=i*10+j
        ax[i,j].imshow(images[f_index].reshape((5,5)).T)
#         pre_num[image_indexs[f_index]] 为图片的预测值
        ax[i,j].text(2, 4, pre_res[image_indexs[f_index]] , horizontalalignment='center',bbox=dict(facecolor='red', alpha=0.5))

png

a2 就是学到的特征,其实我们看不出啥

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值