一、多分类逻辑回归
import matplotlib.pyplot as plt
import matplotlib
import numpy as np
import scipy.optimize as opt
from scipy.io import loadmat
from sklearn.metrics import classification_report
1.载入数据
path='H:\Coursera-ML-AndrewNg-Notes\code\ex3-neural network\ex3data1.mat'
data=loadmat(path)#data是字典形式
X=data['X']
y=data['y']
#X.shape为(5000, 400)
#y.shape为(5000, 1)
按照原始X数据的每一行像素点画出来的图像是翻转的,所以需要将每一行的数据进行反转
X=np.array([row.reshape(20,20).T.flatten() for row in X])#翻转后展成一维数据
y=y.reshape(5000)
2.画图
(1)画1张图
plt.figure(figsize=(1,1))
plt.matshow(X[3000,:].reshape(20,20),cmap=matplotlib.cm.binary,fignum=0)
plt.xticks([])
plt.yticks([])
plt.show()
- plt.matshow:将矩阵可视化,其中fignum设置为0,更改figsize才能起到改变画布大小的作用
- plt.xticks([]):去掉x轴的值
- plt.yticks([]) 去掉y轴的值
- plt.axis(‘off’) 去掉坐标轴
(2)随机画100张图
choice_num=np.random.choice(5000,100)
choice_image=X[choice_num,:]
fig,ax=plt.subplots(10,10,sharey=True, sharex=True,figsize=(8,8))#sharex和sharey表是共用xy轴的设置。
for i in range(10):
for j in range(10):
ax[i,j].matshow(choice_image[10*i+j].reshape(20,20),cmap=matplotlib.cm.binary)
plt.xticks([])
plt.yticks([])
plt.show()
- plt.subplots:sharex, sharey需要都设置为 True 或者 ‘all’ 时,所有子图共享 x 轴或者 y 轴,才能去掉每一个子图坐标轴的值
3.处理数据
(1)X中插入 x 0 x_0 x0=1
X=np.insert(X,0,np.ones(X.shape[0]),axis=