数据分析系列 27/32 | Python使用matplotlib实现数据可视化

本文介绍了Python中使用matplotlib库进行数据可视化的基础知识,包括条形图、线图、散点图的创建,强调了数据可视化在探索和交流数据中的重要性。通过实例展示了如何利用matplotlib绘制各种图表,帮助理解数据趋势和分布。
摘要由CSDN通过智能技术生成

俗话说得好,一图胜千言。数据可视化是数据科学中的一个重要部分。创建可视化很简单,但是创建优秀的可视化很难。数据可视化有两种主要用途:探索数据和交流数据。
 

PART01  Matplotlib

现在有很多工具都可以用来可视化数据,比如我们常用的Excel,还有数据科学另一门重要的语言R,以及百度的Echarts等可视化工具。今天我们的主角是Python中的matplotlib库(官网:http:// matplotlib.org),相对来说,matplotlib功能不是最强大的,但是对于基本的图形来说,matplotlib很好用。

安装matplotlib如果你已经安装了Python的pip工具,那么你只需要pipinstall matplotlib即可安装。这是最简单的一种方法,建议使用这种方法。

这里我们使用的是matplotlib.pyplot模块。pyplot保持着一种内部状态,你可以一步步创建可视化。一旦创建工作完成,就可以保存了(用savefig())或显示(用show())你的图形。

下面我们就来简单的画一个折线图。大家都知道达康书记比较关系GDP,一心想着提升GDP,2019年我们的全国人均GDP也达到了1W美元,那么我们就简单的让GDP增长起来吧。下面看一下代码和视图:

#折线图from matplotlib import pyplot as plt#设置字体,显示中文from pylab import *from pylab import mpl  mpl.rcParams['font.sans-serif'] = ['SimHei']
#这里只是作图示例,与真实数据无关years = [2010, 2011, 2012, 2013, 2014, 2015, 2016]gdp = [300.2, 520, 1024, 2800.5, 5868.9, 9999.9, 14998.8]
#创建一幅线图,x轴是年份,y轴是gdpplt.plot(years, gdp, color = 'green', marker = 'o', linestyle = 'solid')
#添加一个标题plt.title("人民的名义GDP")
#给y轴加标记plt.ylabel(r"十亿元")plt.ticklabel_format(useOffset=False)plt.show()

 

 

PART02  条形图

 

如果我们想展示一些离散的项目集合中的数量是如何变化的,可以使用条形图。比如:下图显示了几个人拥有的硬币数量。

#条形图from matplotlib import pyplot as plt#设置字体,显示中文from pylab import mpl  mpl.rcParams['font.sans-serif'] = ['SimHei']
coins = ['ming', 'hong', 'monkey', 'dakang', 'ruijin']num_coins = [5, 4, 3, 8, 10]
#条形的默认宽度是0.8,因此我们对左侧坐标加0.1,这样条形就放在中心了xs = [i + 0.1 for i, _ in enumerate(coins)]
#使用左侧x坐标[xs]和高度[num_coins]画条形图plt.bar(xs, num_coins)
plt.ylabel("硬币数量")plt.title("每人拥有硬币数量")
#使用人名标记x轴,位置在x轴上条形的中心plt.xticks([i + 0.5 for i, _ in enumerate(coins)], coins)
plt.show()

条形图也可以用来绘制拥有大量数值取值的变量直方图,以此来探索这些取值是如何分布的。如下图所示。

#直方图from matplotlib import pyplot as pltfrom collections import Counter#设置字体,显示中文from pylab import mpl  mpl.rcParams['font.sans-serif'] = ['SimHei']
grades = [83, 95, 87, 70, 0, 85, 82, 100, 67, 73, 77, 0]decile = lambda grade:grade //10*10histogram = Counter(decile(grade) for grade in grades)
#每个条形向左侧移动4个单位,给每个条形设置正确的高度,条形宽度设置为8plt.bar([x - 4 for x in histogram.keys()], histogram.values(), 8)
plt.axis([-5, 105, 0, 5])   #x轴取值-5到105,y轴取值0到5
plt.xticks([10*i for i in range(11)])   #x轴标记为0,10,。。。100plt.xlabel("十分相")plt.ylabel("学生数")plt.title("考试分数分布图")plt.show()

 

PART03   线图

 

前面说过,可以用plt.plot()来制作线图,这种图形可以涌过来清晰地显示某种事物的趋势。代码和图如下所示:

#线图from matplotlib import pyplot as plt#设置字体,显示中文from pylab import mpl  mpl.rcParams['font.sans-serif'] = ['SimHei']variance = [1, 2, 4, 8, 16, 32, 64, 128, 256]bias_squared = [256, 128, 64, 32, 16, 8, 4, 2, 1]table_error = [x+y for x, y in zip(variance, bias_squared)]xs = [i for i,_ in enumerate(variance)]
#可以多次调用plt.plot方便在同一个图上显示多个序列plt.plot(xs, variance,      'g-', label = 'variance')       #绿色实线plt.plot(xs, bias_squared,  'r-.', label = 'bias_squared')  #红色点虚线plt.plot(xs, table_error,   'b:', label = 'table error')    #蓝色点线
#loc=9表示”顶部中央“plt.legend(loc=9)plt.xlabel("模型复杂度")plt.title("偏差-方差权衡图")plt.show()

 

 

PART04   散点图

散点图是显示成对数据集的可视化关系的比较好的方法,比如画一个你微信的好友数,和你每天使用微信的时间之间的关系。看一下代码和示例图:

#散点图from matplotlib import pyplot as plt#设置字体,显示中文from pylab import mpl  mpl.rcParams['font.sans-serif'] = ['SimHei']
friends = [70, 65, 72, 63, 71, 64, 60, 64, 67]minutes = [175, 170, 205, 120, 220, 130, 105, 145, 190]labels = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']
plt.scatter(friends, minutes)
#每个点加标记for label, friend_count, minute_count in zip(labels, friends, minutes):    plt.annotate(label,                 xy = (friend_count, minute_count), #把标记放在对应的点上                 xytext = (-5, 5),                  #但要有轻微偏离                 textcoords = 'offset points')plt.title("日分钟数与朋友数")plt.xlabel("朋友数")plt.ylabel("花在微信上的日分钟数")plt.show()

今天学习一下Python中使用matplotlib进行数据可视化,数据分析必须做到可视化。

欢迎关注微信公众号,访问更多精彩:数据之魅

如需转载,请联系授权,谢谢合作。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值