二分类逻辑回归:
前面两篇文章针对的是因变量为连续型的,若针对因变量为类别型,线性回归便不再适用。
二分类预测适用场景:选举,中奖,比赛输赢,健康与否,行业未来等。
分类器预测思路:
将带有结果的样本分为训练集和测试集,进行机器学习。训练集用于计算模型,测试集检验模型的准确率。训练集和测试集参数均通过后,可用于预测模型。
《鸢尾花预测》案例
样本数据如下:
共有九十个样本。目的为通过萼片长/宽/花瓣长/宽来预测是否为鸢尾花。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/6f711d5f93fe5b3833c53cf904c9a376.png)
1)打开datahoop平台,上传数据,选择逻辑回归模型
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/a8c991401cbcb1170e566d6fd755b08e.png)
2)确定自变量和因变量
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/eb9ad750ac54a0ebe38184d99d4104bd.png)
3)参数设置
测试集占整体样本的20%
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/9d936e24baa74b48ef8f304468319869.png)
4)结果查看