python 逻辑回归_从零学习python,相关分析之二如何用逻辑回归分类

如何用逻辑回归分类

1)什么是特征和标签?

特征就是数据的属性,比如听歌的时长、歌曲的强度、节奏等等,类别就是标签,比如喜欢或者不喜欢这首歌,标签也代表着对歌曲的预测,即预测喜欢和不喜欢。

2)训练数据和测试数据分别用来做什么?

训练数据是将数据‘喂’给模型,让模型去学习数据中特征或者属性,并能够进行自我的修正,训练好的模型把测试数据‘吃’进去,再看模型的输出是否符合我们的预期准确率。一般情况下是将数据集按二八规则进行分开,即训练数据占数据集的80%,测试数据占数据集的20%。

d439834878981158c4cbb97c03a32ec2.png
机器学习分类过程

3)什么是决策面?

决策面通常位于两个不同类别的某个位置上。机器学习中有很多现成的模型供我们去理解和使用,这里特征逻辑回归中分类的决策面。

68d001371e83af2c6b12ead5d34f816d.png
在这个图中,绿色是喜欢的音乐,黄色的是不喜欢的音乐,当测试数据进来的时候进行自动分类

4)用什么指标判断分类结果的准确性?

使用模型准确率这个指标来判断机器模型的好坏,或者说是分类结果的准确性。,即正确率=正确分类个数/数据总数

0d28f06ae5bc8cc0b8d887b28cbe7051.png

5)什么是逻辑回归?

这里的逻辑回归指的是二分分类的逻辑回归,那什么是二分分类,是说我们的结果是两个不同的结果,即两个不同的标签

4b1d162f213288f85e51f60c7409204a.png

6)如何用Python实现逻辑回归?

28e97548899959b62ae1f41163d4d0e6.png
建立数据集

e037b1187ef0b916b7a8f81285b3b33e.png
提取特征和标签

6ad97bdfc460fd467dab884141b606e2.png
使用sklearn.model_selection中的 train_test_split函数随机提取训练数据(train)和测试数据(test),.8代表着按照80%的比例随机分配train和test

51d622701c889cf345b06a9014ccfe53.png
建立训练模型示意图

76266183315650aeb70793fe5f2b1385.png
训练模型(使用训练数据)

25f42dabc1324f9fa7f3490e3e1ab756.png
评估模型准确率,这里得到的结果为1,是错的,使用score函数

3723eb837e67df1ef6d68749f378a792.png
进一步理解什么是逻辑函数

8036f110f1deb8c26fb2f18340cf626f.png

7)为什么分类算法‘逻辑回归’叫做‘回归’

逻辑函数,是一个纵轴在0和1之间并穿过中心点0.5的光滑函数,不需要记住公式哦,为什么叫逻辑函数,是因为下图中的z代表的是线性回归,公式如图:

00380c122fe45535d7e6a726d50c2243.png

8)逻辑函数值表示的是什么?

下图横轴代表的是学习的时间,纵轴代表的是通过考试的概率,即分类结果标签为1时的概率值。

18ef4f9594e6a0e1e63e319776850118.png

那么如何使用这个值呢?或者说如何映射到决策面上呢?如图。

8a2a9de2ceff6dc4d50bbc3278d309a2.png
注意:上图绿色的字体应该是y<0.5,特征=0,这样就将概率映射到标签上了

9)3种数据类型?

53357bc67773a3a79e3dcd2470b6e3b0.png

10)分类和回归有什么区别?

2fe108cb3bc8868ff7f85f554d5fdbbd.png

小结:

2619bb759b5adb112a35a827933d37b1.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值