特征选择是非常关键的步骤,选入大量的特征不仅会降低模型效果,也会耗费大量的计算时间,而漏选的特征也会直接影响到最终的模型结果。一般情况下主要利用以下办法进行特征选择。
1.方差选择法
假如某列特征变化一直很平缓,所以说明这组特征对预测结果影响不大,所以应该计算出各个特征的方差选择方差大于自身阈值的特征。
2.相关系数,统计检验
相关系数或者统计检验都可以用来特征选择。
3.互信息法
互信息法也经常用来评价自变量对因变量的相关性。
4.基于机器学习的特征选择法
主要是针对特征和响应变量建立预测模型,例如用基于树的方法(决策树,随机森林,GDBT),或者扩展的线性模型。
hi 认识一下?
微信关注公众号:全都是码农 (allmanong)
你将获得:
关于人工智能的所有面试问题一网打尽!未来还有思维导图哦!
回复121 立即获得 已整理好121本python学习电子书。
回复89 立即获得 程序员史诗级必读书单吐血整理四个维度系列89本书。
回复167 立即获得 机器学习和python学习之路史上整理大数据技术书从入门到进阶最全本(66本)
回复18 立即获得 数据库从入门到进阶必读18本技术书籍网盘整理电子书(珍藏版)
回复56 立即获得 我整理的56本算法与数据结构书
未来还有人工智能研究生课程笔记等等,我们一起进步呀!