matplotlib数据分析

matplotlib数据分析

数据可视化也是数据科学中非常重要的一节,面对繁杂的数据我们很难理出头绪,但是画出数据的分布图就不一样了,数据的内在规律清晰可见,尤其是在向领导汇报工作的时候,如果你拿的是一张张表格那基本可以断定你要鸡鸡了,相反,如果你带着一份精美的数据分析图表,不加薪怪你老板没眼光!!

上代码,这里的数据使用的还是上节的数据!友情提示,我们的数据长这样!
在这里插入图片描述
我们的任务是看下商铺评分数据分布!先上代码,再看结果

import matplotlib.pyplot as plt 
plt.hist(data["商铺评分"])
plt.show()

在这里插入图片描述
在此看到的就是“商铺评分”数据直方图分布!接下来就是针对直方图的美化!

增加了参数bins的设置,这样直方图的条数更多了!

import matplotlib.pyplot as plt 
plt.hist(data["商铺评分"], bins = 30)
plt.show()

在这里插入图片描述
从上图可以看出,有少量的数据分布在0.7附近,区别于大多数数据,因此可以判定,这部分数据为异常值!接下来考虑怎样将这部分值滤掉!

import matplotlib.pyplot as plt 
data = data[data["商铺评分"]>0.7]  # 数据过滤
plt.hist(data["商铺评分"], bins = 60)
plt.show()

在这里插入图片描述
将异常数据过滤后可以看出数据基本分布在0.97左右!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值