逻辑回归分析,是分类和预测算法中的一种,预测的结果只有两种可能,考试通过或不通过,推送一个商品,用户购买或者不购买,是一个二分类问题,我们将二分类的结果用0和1表示。逻辑回归算法就是输入特征预测结果是0或1的算法。
逻辑回归算法的步骤:收集数据
数据清洗
提取特征
构建模型
评估模型
预测结果
一、收集数据
#导入数据分析包
from collections import OrderedDict
import pandas as pd
#数据集
examDict={
'学习时间':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,
2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50],
'通过考试':[0,0,0,0,0,0,1,0,1,0,1,0,1,0,1,1,1,1,1,1]
}
examOrderDict=OrderedDict(examDict)
examDf=pd.DataFrame(examOrderDict)
因为数据很整洁,这里就省略数据清洗的步骤。
二、特征提取
提取特征和标签组建成需要的数据集
#特征features
exam_x=examDf.loc[:,'学习时间']
#标签labes
exam_y=examDf.loc[:,'