![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
sklearn
qq_41584674
这个作者很懒,什么都没留下…
展开
-
特征预处理
概念:通过特定的统计方法姜数据转换为算法要求的数据 方法: sklearn特征处理API sklearn.preprocessing 归一化: 通过最大值和最小值对数据进行处理将数据转换为[0,1]之间的数,使得所有特征所占比例大致相同。 缺点:对于异常点的处理不好,最大值最小容易受异常点影响(鲁棒性较差) 标准化: 通过平均值标准差对数据进行处理,将数据转换为平均值为0, 标准差为1 的数据。 ...原创 2018-10-09 15:49:59 · 423 阅读 · 0 评论 -
数据的降维
方式: 1、特征选择: 主要方法: Filter(过滤式):VarianceThreshold Embedded(嵌入式):正则化、决策树 Wrapper(包裹式) Filter:删除低方差的特征。 2、主成分分析: PCA:特征数量达到上百个时,使数据维数压缩,尽可能降低原数据的维数。 当数据特征较多时,特征之间可能是相关的。 ...原创 2018-10-09 16:57:45 · 116 阅读 · 0 评论