理论
时间过得太快
痴迷于AI的生物狗
展开
-
为什么决策树模型不考虑变量之间的共线性?
在做线性回归时,假设之一是要求自变量之间没有强共线性,但是用决策树模型做预测时,却没有这个要求。于是乎,查询了一下,在Quora上找到了相关答案。Is multicollinearity a problem with gradient boosted trees?总结一下,主要有下面几个原因1.在统计分析中,作推断(inference)时,如果自变量存在共线性,将无法区分它们对因变量的影响,因此无...翻译 2018-04-24 19:09:42 · 8668 阅读 · 1 评论 -
百科全书
1.Pearson correlation 和 Spearman correlation的区别是什么?A correlation coefficient measures the extent to which two variables tend to change together. The coefficient describes both the strength and the dir...翻译 2018-04-25 15:50:00 · 155 阅读 · 0 评论 -
python常用算法
Quick Sort 快排def QuickSort(myList): if len(myList) > 1: pviot = myList[0] low = QuickSort([x for x in myList if x < pviot]) mid = [x for x in myList if x== pviot] ...原创 2018-05-10 22:52:26 · 251 阅读 · 0 评论 -
数据科学之路(Becoming a Data Scientist – Curriculum via Metromap)
http://nirvacana.com/thoughts/2013/07/08/becoming-a-data-scientist/转载 2018-05-07 14:12:43 · 449 阅读 · 0 评论 -
Bias-Variance tradeoff
通常我们对监督学习模型进行评估的时候, 需要权衡variance和bias.模型评估主要根据公式,即用squred mean error来评估.通过一系列推导可以证明:(来源https://en.wikipedia.org/wiki/Bias%E2%80%93variance_tradeoff)因此模型的拟合效果是由的方差和偏差构成的. 方差高的模型,往往更复杂, 有更多的参数...转载 2018-09-27 19:00:58 · 621 阅读 · 0 评论 -
为什么样本方差是除以N-1而不是N?
具体链接请参考: http://www.visiondummy.com/2014/03/divide-variance-n-1/有空了再翻译翻译 2018-09-27 19:50:02 · 1399 阅读 · 0 评论