![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
m0_37823430
这个作者很懒,什么都没留下…
展开
-
转 特征工程
1 特征工程是什么? 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面: 特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。首次接触到s...转载 2018-04-02 19:38:36 · 90 阅读 · 0 评论 -
使用sklearn进行数据挖
1 使用sklearn进行数据挖掘1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样...转载 2018-04-03 00:53:02 · 205 阅读 · 0 评论 -
决策树剪枝
理想的决策树有三种:1.叶子节点数最少2.叶子加点深度最小3.叶子节点数最少且叶子节点深度最小。在实际的操作中还会设计到ID3算法的收敛,过度拟合等问题下面依次进行描述1.ID算法收敛2.过度拟合问题1.ID3算法的收敛当ID3确定根节点以及后续节点之后,因此当算法满足以下条件该分支的既可以结束1.该群数据的每一个数据都已经归类到同一类别中2.该群数据已经没有办法找到新的属性进行节点分割3.该群数...原创 2018-04-25 22:16:16 · 216 阅读 · 0 评论