机器学习基础概念

机器学习: 
本单中,
1.介绍了sklearn包的交大模块,分别是:分类,回归,聚类,降维,模型选择及预处理。 
2. 介绍了机器学习的4个核心API模块,分别是Ensemble, Pipeline, Multiclass及ModelSelection 
3. 介绍了机器学习是如何完成及度量的。 
4. 机器学习的分类, 有监督,无监督, 半监督及增强学习。而深度学习和迁移学习,则是模式,并不是一种方法。 重点介绍了有监督学习和无监督学习。 
5. 使用实例的方式完成了最简单的有监督学习及无监督学习的基本使用方法。
    (1) 数据选择;
    (2) 使用采样数据进行学习;
    (3) 使用测试数据进行验证;
    在使用监督学习和无监督学习时,fit()方法的使用,在参数的使用上有一些区别 。 
    
    
编码问题
1. 编码的分类 :
    One-hot编码, 也称为热独编码, 将某一组特征值使用编码的方式来进行表达的方式,其中只有在特定的特征值位上才能用1进行表示 。 
    优点:每个特征都有对应的类别, 失踪数据可以编码为全零矢量。 
    缺点:自由度太大,训练模型不唯一。 
    
2. dummy编码,也称为虚拟编码,虚拟编码可以有k-1个特征值。     
   优点:在线性回归中,容易被拟合。 
   缺点:不能轻易处理缺失数据。 
    
    
3. Effect编码:效果编码
    优点:使用不同的代码来避免重复的问题。
  缺点:没有单一特征值代表参考类别,而且使用-1的矢量,在存储和计算来时,代价都很昂贵。 
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值