学完线性回归,逻辑回归建模+评估模型的过程就相对好理解很多。其实就是换汤不换药。
逻辑回归不是回归算法,而是分类算法,准确来说,叫逻辑分类
逻辑分类本质上是二分分类,即分类结果标签只有两个
逻辑回归建模-评估模型的过程
如何建立有序的二维数据结构
1.字典是无序的,所以引入一个OrderedDict来让顺序变成有序
2.数据集转成Pandas的二维数据结构进行处理
如何实现逻辑回归
1.提取出特征和标签
提取出某一列:loc (根据索引进行提取)
2.建立训练数据和测试数据
从样本中随机的按比例选取训练数据(train)和测试数据(test):
使用交叉验证(sklearn.model_selection)中的train_test_split
train_test_split三个参数:
第一个参数:所要划分的样本特征
第二个参数:所要划分的标签特征
第三个参数:train_size= (<0的小数:训练数据的占比 >0的整数:样本的数量)
x_train , x_test , y_train , y_test 各分配到一定比例的数据
3.使用训练数据训练模型
注意:sklearn要求输入的特征必须是二维数组的类型,但是因为我们目前只有1个特征,所以需要用安装错误提示用reshape转行成二维数组的类型
导入逻辑回归:使用sklearn.linear_model中的LogisticRegression
用LogisticRegression创建训练模型:model = LogisticRegre