本文是小白文章,大神请忽略。
逻辑回归,其与线性回归的不同在于,逻辑回归的输出结果为二分分类结果,可以视为 true 或false 多以成为逻辑回归。
数据类型分为: 1.数值数据(定量数据) ——离散数据 与 连续数据
2.分类数据(定性数据)
3. 时间序列数据
用猴子老师的图片做一下总结:
这两张图对比了回归和分类的方法,下面是逻辑回归实例。
2.准备数据
3.提出问题
该数据是“学习时间”与“通过考试”,组成的数据表,提出问题如下:
1.利用机器学习模型,计算“学习时间”所对应“通过考试”的概率?
2. 该模型是否可以预测某个学习时间,能否通过考试?
4. 理解数据
通过绘制散点图,观察数据
如上图所示,标签数据为分类数据,适合采用逻辑回归模型进行机器学习。
5. 构建模型
5.1选取特征和标签,并拆分为训练数据和测试数据
原数据数量为20,从中随机选取80%为训练数据,20%为测试数据。
5.2
绘制训练数据与测试数据的散点图。
5.3 训练模型
用sklearn的LogisticRegression构建逻辑回归模型,并训练模型
6.评估模型
用score来评估逻辑回归的预测准确率。
正确率为0.75,表示逻辑回归模型对测试数据预测,其正确率为75%。
7.用模型进行预测
更好理解逻辑回归结果的含义,先对学习时间为5小时,通过考试的概率,以及预测结果。
经验:
多思考代码含义,多练习。