建模
ErinLiu虎哥的铲屎员
这个作者很懒,什么都没留下…
展开
-
数据预处理--对偏态数据
转载自:https://blog.csdn.net/csdn_lzw/article/details/83387570一、何为数据的偏态分布?频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。偏态分布是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。如果频数分布的高峰向左...转载 2019-08-30 12:42:46 · 17239 阅读 · 1 评论 -
用xgboost模型对特征重要性进行排序
转载自:https://blog.csdn.net/waitingzby/article/details/81610495 用xgboost模型对特征重要性进行排序在这篇文章中,你将会学习到:xgboost对预测模型特征重要性排序的原理(即为什么xgboost可以对预测模型特征重要性进行排序)。 如何绘...转载 2019-09-07 16:49:24 · 3326 阅读 · 0 评论 -
《如何进行特征选择》
文章目录过滤(Filter)包裹(Warpper)嵌入法(Embedding)一个典型的机器学习任务,是通过样本的特征来预测样本所对应的值。如果样本的特征少了,我们会考虑增加特征,比如Polynomial Regression就是典型的增加特征的算法。在前一周的课程中,相信大家已经体会到,模型特征越多,模型的复杂度也就越高,越容易导致过拟合。事实上,如果我们的样本数少于特征数,那么过拟合就不可避...转载 2019-09-20 16:04:18 · 747 阅读 · 0 评论