python数据统计可视化_数据之美——Python数据可视化(1)

数据可视化就是使用图形图表等方式来呈现数据,图形图表能够高效清晰地表达数据包含的信息。数据可视化在各个领域都得到了广泛的应用,例如,产品销售数据的可视化,统计样本数据可视化,机器学习数据可视化等。因此,掌握一些数据可视化的技能是非常有必要的。

在这篇文章中我们会简单的介绍一下基于Python的数据可视化。Python有很多非常优秀易用的数据可视化的库,作为入门文章我们这里使用Python的matplotlib,事实上Python中很多可视化库都是基于matplotlib开发的,例如pandas等。下面我们将使用几种不同数据图表来讲解基于matplotlib的数据可视化。

线段图

线条图适合用来呈现基于时间序列或有固定间隔的序列数据。横轴表示时间或者间隔,而纵轴则表示对应的数值。例如,店铺每天的销售额,旅游景点每天游客接待量等。现在假设我们有某个店铺最近一年的的销售额数据,使用线段图可以非常直接的呈现出来。

代码和线图图如下:

u=105139804,607478145&fm=173&app=25&f=JPEG?w=609&h=386&s=8A61C51011CAF54B0ED8C5DE000080B2

u=3015414024,3254404226&fm=173&app=25&f=JPEG?w=640&h=480&s=2912CC1253DE7FD84C0F3D460300D0EB

条形图

条形图主要是用来将数据分类显示,横轴表示数据的类型,而纵轴则表示对应类型的数值。例如,我们有5种不同类型产品的销售量,利用条形图我们可以非常方便的把数据呈现出来。

u=1768094001,2620675646&fm=173&app=25&f=JPEG?w=640&h=168&s=8013CF304F6655225AF09DD30000C0B3

u=1864694917,2591632535&fm=173&app=25&f=JPEG?w=640&h=480&s=61328473CC87BB194EA65DD2020030EB

柱状图

柱状图,也叫直方图,通常用来呈现变量的分布。它将数据按照一定的区间分组,而纵轴表示位于这一区间数据的个数。例如,下面我们生成一组正态分布的随机数据,柱状图按照一定的区间分组数据,并统计位于各个区间的数据量。

u=4144475259,43978853&fm=173&app=25&f=JPEG?w=462&h=251&s=8A61C71001CA6D494A7501DA000080B2

u=2615515468,2125306820&fm=173&app=25&f=JPEG?w=640&h=480&s=59223C720A86F20B6DD79CC70200F0EB

箱线图

箱线图用来显示一组数据的分散情况。在箱线图中,数据集的50%被一个矩形覆盖,既矩形的底边位于数据集的25%处,矩形的顶边位于数据集的75%处;在矩形中心既数据集50%处有一条横线;矩形顶边和底边差值的1.5倍称为IRQ值,离矩形底边和顶边IRQ处分别画一条称为边缘的线。所有位于边缘线以外的数据点称为异常点。

下面我们随机的生成三组数据,并使用箱线图呈现每组数据的分散情况。

u=2687191727,2152644107&fm=173&app=25&f=JPEG?w=623&h=242&s=8861CF1097D06C61066DC4DA000080B2

u=1020817268,777191680&fm=173&app=25&f=JPEG?w=640&h=480&s=4DA635722B0B404B5E5D30CA0000C0B1

散点图

散点图是数据在直角坐标系平面的分布图。散点图是非常有用的的显示两组变量之间的关系。例如身高和体重之间的关系,产品价格与销量之间的关系等。

下面的代码中,我们随机的生成1000组数据,然后使用散点图呈现出来。

u=1391603844,938233371&fm=173&app=25&f=JPEG?w=571&h=344&s=8A61C51005CA754B0C78C0DA0000C0B2

u=144702807,2999626876&fm=173&app=25&f=JPEG?w=640&h=480&s=21BA5C3219D16AC645F3B4C60200C0A3

最后

这篇文章里我们简单的讨论了如何使用matplotlib绘制条形图和柱状图等基本的图表,后续文章中我们介绍更多的python可视化库和一些更复杂的绘图。

往期文章:Python开发必备利器之Virtual EnvironmentPython爬虫入门,快速抓取大规模数据(完结篇)Python爬虫入门,快速抓取大规模数据(第五部分)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值