自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 用ROC曲线评估logistic回归模型性能

ROC曲线被广泛用于二分类输出模型的性能评估。这里我们将给出一个简单的例子,使用数据集“diamonds”创建logistic回归模型,然后通过绘制ROC曲线来确定carat、cut和clarity这三个因素中哪个最能预测钻石的昂贵与否。探索和准备数据> library(ggplot2)> str(diamonds) # diamonds是ggplot2里的数据集C

2018-02-04 18:12:34 30843 1

原创 辨Data Scientist之真假(四)

问题四:什么是查准率和查全率?它们与ROC曲线有什么关系? 真阳性(True Positive, TP):样本是阳性的,分类器将样本也分类为阳性; 假阴性(False Negative, FN):样本是阳性的,分类器将样本分类为阴性; 真阴性(True Negative, TN):样本是阴性的,分类器将样本也分类为阴性; 假阳性(False Positive, FP):样

2018-02-04 00:38:28 417

原创 多元线性回归-Part1(以医疗费用为例)

相较于一元线性回归,多元线性回归是用来确定2个或2个以上变量间的统计分析方法,其基本的分析方法和一元线性回归是类似的。 优点: 1.可适用于几乎所有的数据; 2.提供了特征与结果之间关系的强度和大小的估计。 缺点: 1.对数据做出了很强的假设; 2.模型形式必须事先指定; 3.不能很好地处理缺失数据。

2018-02-02 00:23:02 5416 2

原创 多元线性回归-Part2(以医疗费用为例)

在Part1中,我们已经根据保险受益者的数据拟合出线性回归模型,接下来要做的是评估和提高模型的性能。 (四)评估模型的性能> summary(ins_model) ### summary()给出评估模型性能的信息。Call:lm(formula = charges ~ age + children + bmi+ sex + smoker + region,

2018-02-01 23:43:31 2359

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除