数据分析-数据清洗与整理

1.数据清洗

第一步:对异常值进行处理
首先,查看原数据库是否一样;
然后,查询是否信息录入时出现错误;
最后,看看是不是顾客随意填写的信息
第二步:对离群值进行处理
首先,查询是否与原数据库一致;
然后,查询是否信息录入错误;
最后,判断是否符合顾客实际情况
#如果经过以上两步处理,确定数据不存在问题,就要进行下面的操作
第三步:对异常的数据用平均值、中位值进行替代;对离群值进行具体的判断,根据他对最终决策产生的影响考虑是否对他进行删除处理。

2.数据整理

#使用SQL中的inner join……on语句进行表的拼接
select s.ID,p.sex,p.age
from sales s inner join person p on sales_ID=person_ID;
#得到的是两个表中都有的信息进行连接,如下图所示

在这里插入图片描述

#使用SQL中的left/right join……on语句进行表的拼接
select s.ID,p.sex,p.age
from sales s left/right join person p on sales_ID=person_ID;
#得到的是某个表中都有的信息进行连接,如下图所示

在这里插入图片描述
在这里插入图片描述

#使用SQL中的outer join……on语句进行表的拼接
select s.ID,p.sex,p.age
from sales s outer join person p on sales_ID=person_ID;
#得到的是两个表中所有的信息进行连接,如下图所示

在这里插入图片描述

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值