机器学习实验1-----线性模型实现
一、实验目的
- 理解线性模型原理并能够利用线性模型解决相关问题。
- 熟练掌握利用Scikit-learn 中和线性模型相关的模块解决问题。
二、实验内容
- 使用线性判别分析和对数几率回归解决手写数字识别问题。
三、实验要求
- 对问题进行简单描述并给出线性判别分析和对数几率回归解决分类问题的原理。
- 将问题相关数据集划分成训练集和测试集。
- 给出线性判别分析和对数几率回归解决手写数字识别问题的代码。
- 对训练后的模型进行交叉验证,进而对不同模型进行比较和评估。
四、实验分析及代码
引入数据,划分训练集和测试集
from sklearn import datasets
digits = datasets.load_digits()
from sklearn.model_selection import train_test_split
x=digits.data
y=digits.target
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size= 0.2)
导入画图工具Matplotlib
import matplotlib.pyplot as plt
for i in range(25):
plt.subplot(5, 5, 1+i)
plt.imshow(digits.images[i], cmap='bone') #画出前25个数字图像,按照五行五列的格式输出
plt.axis('off')
plt.savefig('test.tif')
plt.show()
引入模块建立模型
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis #引入线性判别分析模块
from sklearn.linear_model import LogisticRegression #引入对数几率回归模块
model_dui=LogisticRegression(random_state= 0,solver= 'newton-cg') #建立对数几率回归模型
model=LinearDiscriminantAnalysis () #建立线性判别分析模型
模型训练,预测,返回结果验证
model_dui.fit(x_train,y_train)
model.fit(x_train,y_train) #模型参数学好了
y_predict_dui=model_dui.predict(x_test)
y_predict=model.predict(x_test) #进行预测
y_predict_dui_proba=model_dui.predict_proba(x_test) #model.predict_proba()函数返回数组,数组每个元素是新样本属于某一类别的概率
y_predict_proba=model.predict_proba(x_test) #score方法,返回结果
score_dui=model_dui.score(x_test,y_test)
score=model.score(x_test,y_test)
print(y_predict_proba )
print(y_predict )
print(y_predict_dui_proba )
print(y_predict_dui )
print(score)
print(score_dui )
十则交叉验证
from sklearn.model_selection import cross_val_score
scores_dui=cross_val_score (model_dui ,x,y,cv=10) #cv为则数
scores=cross_val_score (model,x,y,cv=10)
print(scores)
print(scores_dui)