关于SQL和python数据预处理

关于SQL需要掌握:

  1、提取特定情况下的数据,比如提取2017年的数据,提取前100个顾客的数据等

  2、数据库的增、删、查、改,这些命令都很简单,记住即可

  3、数据的分组聚合、如何建立多个表之间的联系,这在处理多维度、多个数据集时很有用

对于以上,需要掌握一些基本的操作,找一些数据集练习一下即可

****************************************************************************

关于python进行数据预处理,对于数据预处理,学会 pandas (Python包)的用法,应对一般的数据清洗就完全没问题了。需要掌握的知识点如下:

  • 选择:数据访问(标签、特定值、布尔索引等)

  • 缺失值处理:对缺失数据行进行删除或填充

  • 重复值处理:重复值的判断与删除

  • 异常值处理:清除不必要的空格和极端、异常数据

  • 相关操作:描述性统计、Apply、直方图等

  • 合并:符合各种逻辑关系的合并操作

  • 分组:数据划分、分别执行函数、数据重组

  • Reshaping:快速生成数据透视表

转载于:https://www.cnblogs.com/rayshaw/p/8531342.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值