本问包括以下内容:逻辑回归
分类与回归的区别
小结
一、逻辑回归
1.逻辑回归:虽然名字叫“回归”,但它实际上是解决分类问题的。本质上是一个“回归”模型,因为逻辑回归它将「样本的特征」与「发生的概率」联系起来,而概率其实是一个数值。"逻辑回归"可以理解成一个分类型的回归算法。0.5为阈值,当y>0.5时标签为1,当y<0.5时标签为0
2.代码实战逻辑回归
(1)建立一个逻辑回归的数据集
from collections import OrderedDict
import pandas as pd
#数据集
examDict={
'学习时间':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,
2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50],
'通过考试':[0,0,0,0,0,0,1,0,1,0,1,0,1,0,1,1,1,1,1,1]
}
examOrderDict=OrderedDict(examDict)
examDf=pd.DataFrame(examOrderDict)
examDf.head()
(2)提取特征和标签
#特征features
exam_X=examDf.loc[:,'学习时间']
#标签labes
exam_y=examDf.loc[:,'通过考试']