- 博客(4)
- 收藏
- 关注
原创 用ROC曲线评估logistic回归模型性能
ROC曲线被广泛用于二分类输出模型的性能评估。这里我们将给出一个简单的例子,使用数据集“diamonds”创建logistic回归模型,然后通过绘制ROC曲线来确定carat、cut和clarity这三个因素中哪个最能预测钻石的昂贵与否。探索和准备数据> library(ggplot2)> str(diamonds) # diamonds是ggplot2里的数据集C
2018-02-04 18:12:34 30867 1
原创 辨Data Scientist之真假(四)
问题四:什么是查准率和查全率?它们与ROC曲线有什么关系? 真阳性(True Positive, TP):样本是阳性的,分类器将样本也分类为阳性; 假阴性(False Negative, FN):样本是阳性的,分类器将样本分类为阴性; 真阴性(True Negative, TN):样本是阴性的,分类器将样本也分类为阴性; 假阳性(False Positive, FP):样
2018-02-04 00:38:28 418
原创 多元线性回归-Part1(以医疗费用为例)
相较于一元线性回归,多元线性回归是用来确定2个或2个以上变量间的统计分析方法,其基本的分析方法和一元线性回归是类似的。 优点: 1.可适用于几乎所有的数据; 2.提供了特征与结果之间关系的强度和大小的估计。 缺点: 1.对数据做出了很强的假设; 2.模型形式必须事先指定; 3.不能很好地处理缺失数据。
2018-02-02 00:23:02 5420 2
原创 多元线性回归-Part2(以医疗费用为例)
在Part1中,我们已经根据保险受益者的数据拟合出线性回归模型,接下来要做的是评估和提高模型的性能。 (四)评估模型的性能> summary(ins_model) ### summary()给出评估模型性能的信息。Call:lm(formula = charges ~ age + children + bmi+ sex + smoker + region,
2018-02-01 23:43:31 2360
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人