机器学习入门(1) 逻辑回归
- 了解逻辑回归的理论
- 掌握逻辑回归的sklearn函数调用使用,并将其运用到鸢尾花数据集预测
1 逻辑回归原理
标记两篇写的很好的博文
2 demo实践
下面用一个简单的demo来初步介绍逻辑回归的实践方式。
2.1 库函数导入
import numpy as np
# 导入两个画图库
import matplotlib.pyplot as plt
import seaborn as sns
# 导入逻辑回归函数
from sklearn.linear_model import LogisticRegression
sklearn
(Scikit-learn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法- 具体使用可查阅sklearn中文官方文档
2.2 模型训练
# 构建一组简单的数据集
x = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])
y = np.array([0, 0, 0, 1, 1, 1])
input_data
# 用逻辑回归模型拟合构造的数据集
lr = LogisticRegression()
lr = lr.fit(x, y) #拟合方程为 y=w0+w1*x1+w2*x2
2.3 查看模型参数
#查看模型的权值 w1,w2
print('逻辑回归模型的权值:',lr.coef_)
##打印模型的w0 (截距)
print('逻辑回归模型的截距(w0) :',lr.intercept_)
2.4 数据可视化
利用matplotlib.pyplot进行简单的数据可视化
# 可视化构建的数据集
plt.figure()
# 散点图
plt.scatter(x[:,0],x[:,1], c=y, s=50, cmap='viridis')
plt.title('Dataset')
plt.show()
# 可视化决策边界
plt.figure()
plt.scatter(x[:,0],x[:,1], c=y, s=50, cmap='viridis')
plt.title('Dataset')
nx, ny = 200,100
x_min, x_max = plt.xlim()#提取上面图片的X轴大小
y_min, y_max