机器学习算法基础2(数据降维、算法分类、sklearn数据集获取、转换器与估计器)

目录

1.特征选择 

特征选择主要方法:

1.1过滤式

 1.2主成份分析

 1.3 案例分析

2.机器学习算法分类  开发流程

2.1 数据类型

2.2 机器学习算法分类

监督学习:特征值+目标值

无监督学习:特征值

3.sklearn数据集获取

3.1数据集划分

分类数据集

 数据集分割

 回归数据集

 4.转换器与估计器

4.1转换器 实现特征工程

4.2 估计器  实现算法


1.特征选择 

特征选择原因

冗余:部分特征的相关度高,容易消耗计算性能
噪声:部分特征对预测结果有负影响

特征选择主要方法:

主要方法(三大武器):Filter(过滤式):VarianceThreshold

                      Embedded(嵌入式):正则化、决策树

               Wrapper(包裹式)

1.1过滤式

过滤掉低方差特征

sklearn.feature_selection.VarianceThreshold

def var():
    '''
    特征选择 删除低方差
    :return:
    '''
    var= VarianceThreshold(threshold=0.0)
    data =var.fit_transform([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]])
    print(data)

if __name__=='__main__':
    var()

第1列第4列被删除(threshlod=0.0)删除方差为0的列

 1.2主成份分析

sklearn. decomposition

 PCA:特征数量达到上百的时候,考虑是否需要用PCA,数量减少数据也会改变

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值