读《python数据挖掘与分析实战》之七

python主要数据预处理函数

每一个函数的使用可以自行百度,这里就不记录了,书上介绍还是挺全面的!!!

小结

本章介绍了数据预处理的4个主要任务:数据清洗,数据集成,数据变换和数据规约。

数据清洗主要介绍了对缺失值和异常值的处理,处理缺失值的方法分为三类:删除记录,数据插补和不处理,处理异常值的方法有删除含有异常值的记录,不处理,平均值修正和视为缺失值;数据集成是合并多个数据源中的数据,并存放到一个数据存储的过程,对该部分的介绍从实体识别问题和冗余属性两个方面进行;数据变换介绍了如何从不同的应用角度对已有属性进行函数变换;数据规约从属性规约和数值规约两个方面介绍了如何对数据进行规约,使挖掘的性能和效率得到很大的提高,通过对原始数据进行相应的处理,将为后续挖掘建模提供良好的数学基础

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值