学习目标:
1.理解并掌握逻辑回归分类方法; 2.掌握逻辑回归的模型效果评估; 3.掌握决策树分类应用场景。 |
学习内容:
1.本次实验是电信客户的流失率分析和预测。 2.通过分析用户的套餐、通话、流量、行为、合约、关联购买、使用月数等情况,对用户是否会流失进行分析,并预测一些用户的流失可能性, 3.可以根据用户所关联的情况,推出一些新的政策或活动进行挽留。 |
学习时间:
1、 周一至周五晚上 7 点—晚上9点
2、 周六上午 9 点-上午 11 点
3、 周日下午 3 点-下午 6 点
学习产出:
大家好丫!我是honey 今天想和大家分享一下分类,我自己也是半蒙半懂的状态,有很多问题我都有疑惑。下面我们一起来看看吧!
在这这之前我们要先明白评估模型好坏的指标以及分类到底用什么模型更好,因为影响数据结果的不只一个因素,所以我们要用决策树来排个根节点的序,哎!反正我是这样想的,然后说说我们这次用到的评估模型的一些词的含义吧!
1.逻辑回归模型、决策树 决策树分类原理 决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树分为分类树和回归树两种,分类树对离散变量做决策树 2.AUC、fpr、tpr; AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。 TPR以及FRP是在做分类、检测常用的指标分析,TPR为真正率,FPR为假正率,他们均是基于混淆矩阵的度量标准。 3.ROC曲线; ROC中文名为:受试者操作特征(receiver operating characteristic curve),源于二战雷达信号分析技术。 ROC曲线绘制:分别计算模型结果的FPR与TPR,然后将TPR作为纵坐标,TPR作为横坐标作图,便可得到ROC曲线,ROC曲线上的每一个点对应一个阈值 |