- 博客(3)
- 收藏
- 关注
原创 Spark之特征选择
特征选择 坊间传言:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。因此特征工程显得尤为重要。最近的工作中做了较多的特征工作,在这里做一个小小的总结。peason特征选择 笔者本身统计学的,一直认为pearson也只能做做相关性分析,判断两个变量相关性什么的。在工作中刚开始并未觉得卡方特征选择效果会有多好,于是退而求其次,选择了peason,这个是spark
2017-03-16 17:56:55 1605
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人