数据挖掘知识
文章平均质量分 92
mmい
这个作者很懒,什么都没留下…
展开
-
Hypothesis Testing
We first set up a null hypothesis that describes the status,then state an alternative hypothesis. In the end, we either need to: reject the null hypothesis and accept the alternative hypoth原创 2016-03-30 19:49:47 · 932 阅读 · 0 评论 -
分类模型到底如何选择
比较决策树和回归表面上看: 决策树可以对付缺失值,而逻辑回归需要挖掘人员预先对缺失数据进行处理。但实际上决策树同样要对缺失值做出某种假设和处理。例如CART在遇到一个变量中有缺失情况时,是用次级变量进行替换切分。这种做法在逻辑回归中也可以办到,但需要单独的编程。而在决策树中,这一步已经嵌入软件的算法引擎。实质上看: 1.逻辑回归对数据整体结构的分析优于决策树,而决策树对局部结构的分析优于逻原创 2016-04-07 09:53:18 · 18981 阅读 · 0 评论 -
ROC曲线
在维基百科中对ROC是这样描述的: 在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,或者叫ROC曲线)是一种座标图式的分析工具,用于 : (1) 选择最佳的信号侦测模型、舍弃次佳的模型。 (2) 在同一模型中设定最佳阈值。 在做决策时,ROC分析能不受成本/效益的影响,给出客观中立的建议。举例来说,用血压原创 2016-04-18 15:18:15 · 727 阅读 · 0 评论