如何用逻辑回归分类
1)什么是特征和标签?
特征就是数据的属性,比如听歌的时长、歌曲的强度、节奏等等,类别就是标签,比如喜欢或者不喜欢这首歌,标签也代表着对歌曲的预测,即预测喜欢和不喜欢。
2)训练数据和测试数据分别用来做什么?
训练数据是将数据‘喂’给模型,让模型去学习数据中特征或者属性,并能够进行自我的修正,训练好的模型把测试数据‘吃’进去,再看模型的输出是否符合我们的预期准确率。一般情况下是将数据集按二八规则进行分开,即训练数据占数据集的80%,测试数据占数据集的20%。
3)什么是决策面?
决策面通常位于两个不同类别的某个位置上。机器学习中有很多现成的模型供我们去理解和使用,这里特征逻辑回归中分类的决策面。
4)用什么指标判断分类结果的准确性?
使用模型准确率这个指标来判断机器模型的好坏,或者说是分类结果的准确性。,即正确率=正确分类个数/数据总数
5)什么是逻辑回归?
这里的逻辑回归指的是二分分类的逻辑回归,那什么是二分分类,是说我们的结果是两个不同的结果,即两个不同的标签
6)如何用Python实现逻辑回归?
7)为什么分类算法‘逻辑回归’叫做‘回归’
逻辑函数,是一个纵轴在0和1之间并穿过中心点0.5的光滑函数,不需要记住公式哦,为什么叫逻辑函数,是因为下图中的z代表的是线性回归,公式如图:
8)逻辑函数值表示的是什么?
下图横轴代表的是学习的时间,纵轴代表的是通过考试的概率,即分类结果标签为1时的概率值。
那么如何使用这个值呢?或者说如何映射到决策面上呢?如图。
9)3种数据类型?
10)分类和回归有什么区别?
小结: