【学习笔记】机器学习算法(一): 基于逻辑回归的分类预测
学习地址:阿里云天池
机器学习中常见的两个问题,一个是回归问题,另一个就是分类问题。本次学习的目标为基于逻辑回归的分类预测。
首先明确,虽然名字中带有回归,但是其本质上是一个分类问题。即使用回归来解决分类问题。
笔记目录:
一、学习知识点概要
二、学习内容
三、学习问题与解答
四、学习思考与总结
一、学习知识点概要
1、首先主要了解了一下逻辑回归这个概念,并对其应用和现状有了认识。其次明确了本次学习的学习目标,掌握理论,熟悉代码。
2、重点学习了代码部分,包括一个Demo实例和一个基于鸢尾花(iris)数据集的分类实例。
二、学习内容
1、Demo代码
代码流程:
Step1:导入库函数。主要用到numpy、matplotlib、seaborn三个库。
Step2:模型训练。
Step3:模型参数查看
Step4:数据和模型可视化
Step5:模型预测
数据集是6个点的坐标,对其进行可视化显示为:
# 可视化决策边界
plt.figure()
plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap='viridis')
plt.title('Dataset')
nx, ny = 200, 100
x_min, x_max = plt.xlim()
# xlim()函数功能是:获取或者是设定x座标轴的范围,当前axes上的座标轴。
y_min, y_max = plt.ylim()
x_grid, y_grid = np.meshgrid(np.linspace(x_min, x_max, nx),np.linspace(y_min, y_max, ny))
z_proba = lr_clf.predict_proba(np.c_[x_grid.ravel(), y_grid.ravel()])
# predict_proba返回的是一个n行k列的数组,第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。