Python图形绘制:如何用Matplotlib和pandas绘图?

用Matplotlib库绘图

Matplotlib是一个非常好用的高质量绘图工具库,可以根据输入的数据绘制各种图形,如折线图、柱状图、饼图、散点图等。

1.绘制折线图

折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势。下面我们绘制一个简单的折线图。

从Matplotlib库导入pyplot模块,简称plt。

>>> import matplotlib.pyplot as plt

准备绘图时要用到的数据,x和y表示与x轴和y轴对应的数据。

>>> x=[0,1,2,3,4,5]
>>> y=[0,1,4,9,16,25]

调用模块的plot函数绘图。

>>> plt.plot(x,y)

调用模块的savefig函数把图形保存为矢量图。

>>> plt.savefig('H:\示例\第9章\plt_line.svg')

用浏览器打开矢量图,效果如图9-10所示。

Python图形绘制:如何用Matplotlib和pandas绘图?

图9-10

plot函数包括许多参数,除了数据之外,常用的参数如下:color表示折线的颜色,marker表示折线上数据点处的标记风格,linestyle表示折线的类型,linewidth表示线条粗细,markersize表示数据点标记大小。

>>> plt.plot(x,y,color='red', marker='o', linestyle='dashed', linewidth=1, markersize=5)

调用模块的show函数显示图形到屏幕。

>>> plt.show()

显示效果如图9-11所示。

Python图形绘制:如何用Matplotlib和pandas绘图?

图9-11

颜色(color)、标记风格(marker)、线条样式(linestyle)的设置可以进一步简写,可以用每个属性的缩写。例如,“ro:”表示红色、圆点、虚线。

>>> plt.plot(x,y,'ro:', linewidth=1, markersize=5)

常用的颜色缩写包括:蓝(b)、绿(g)、红(r)、蓝绿(c)、洋红(m)、黄(y)、黑(k)、白(w)。

常用的点型缩写包括:点标记(.)、像素标记(,)、实心圈标记(o)、倒三角标记(v)、上三角标记(^)、左三角标记(<)、右三角标记(>)、下花三角标记(1)、上花三角标记(2)、左花三角标记(3)、右花三角标记(4)、实心方形标记(s)、五边形标记(p)、星标记(*)、竖六边形标记(h)、横六边形标记(H)、加号标记(+)、叉标记(x)、钻石标记(D)、菱形标记(d)、竖线标记(|)、横线标记(_)。

常用的线型缩写包括:实线(-)、破折(--)、点画线(-.)、虚线(:)、无线条(空格)。

在Matplotlib中画图,要提供x轴所有的数值以及y轴所有的数值,而且这两个数值列表的数目要能够逐一配对,也就是一个x值要搭配一个y值。上例中,实际上就是将(0,0)、(1,1)、(2,4)、(3,9)、(4,16)、(5,25)这6个点连接起来。

要注意的是,当只输入一维数据的时候,自动将其当作y轴数值处理,x轴默认生成[0,1,2,…]。

下面我们在图中绘制多条折线图。

   import matplotlib.pyplot as plt
   x=[0,1,2,3]
   y0=[4,6,8,10]
   y1=[4,9,16,25]
⓿ plt.plot(x,y0,'bo--',label='电脑')
   plt.plot(x,y1,'rp-',label='手机')
❶ plt.legend(loc='best')
❷ plt.rcParams['font.sans-serif']=['SimHei']
❸ plt.title('2019年各产品销量(单位:万台)', fontsize=20)
   index_name=['1季度', '2季度', '3季度', '4季度']
❹ plt.xticks(x, index_name)
   plt.show()

语句⓿绘制两条不同风格的折线;语句❶调用legend函数设置图例位置;语句❷调用rcParams函数设置中文字体;语句❸调用title函数设置图表标题;语句❹调用xticks函数设置x轴数值,最后调用show函数显示图形,效果如图9-12所示。

Python图形绘制:如何用Matplotlib和pandas绘图?

图9-12

2.绘制其他类型图形

折线图是基于plt.plot函数绘制的。Matplotlib库还提供了许多不同种类图形的函数。

下面我们将多种类型的图形绘制在一起。

   import matplotlib.pyplot as plt
   plt.rcParams['font.sans-serif']=['SimHei']
   x=[0,1,2,3]
   label=['东区','西区','北区','南区']
   value=[2,4,6,8]
⓿ fig=plt.figure()
❶ ax_1=fig.add_subplot(2,2,1)
❷ ax_1.plot(x,value,'rp-')
❸ ax_1.set_xticks([0,1,2,3]) 
❹ ax_1.set_xticklabels(['东区','西区','北区','南区'])  
❺ ax_2=fig.add_subplot(2,2,2)
   ax_2.pie(value,labels=label,autopct='%1.1f%%',startangle=90) 
❻ ax_3=fig.add_subplot(2,2,3)
   ax_3.bar(label,value)
❼ ax_4=fig.add_subplot(2,2,4)
   ax_4.barh(label,value)
   fig.show()
❽ fig.savefig('H:\示例\第9章\pyplot_4.png', dpi=400)

语句⓿调用figure函数新建一个画布,然后在这个画布上添加各种元素;语句❶在2×2的绘图区域添加第一个子图;语句❷在子图中绘制折线;语句❸设定x轴的标签;语句❹设定x轴的标签文字;语句❺绘制饼图;语句❻绘制柱状图;语句❼绘制条形图;语句❽保存图片到本地,效果如图9-13所示。

Python图形绘制:如何用Matplotlib和pandas绘图?

图9-13

9.3.2 用pandas库绘图

Matplotlib库功能强大,但是相对底层。前面章节介绍过的数据分析库pandas,它的绘图功能就是基于Matplotlib库,这里继续介绍用Pandas库绘图的方法。

Series和DataFrame是Pandas库中主要的两种数据结构,都内置了plot方法,可以绘制图形。

1.Series.plot

Series是一个一维数据结构,它由index和value组成,类似于Excel表格中的一列数据,由行号和数据组成。根据这样一列数据,我们可以绘制各种图表,如柱状图、条形图、折线图、饼图等。

下面以实例说明。

⓿ import pandas as pd
   import matplotlib.pyplot as plt
❶ plt.rcParams['font.sans-serif']=['SimHei']
❷ data=pd.Series([2,4,6,8],index=['1季度', '2季度', '3季度', '4季度'])
❸ fig=data.plot(kind='bar', title='2019年各季度销量(单位:万台)',
              figsize=(20,16),fontsize=30)
❹ fig.axes.title.set_size(40)
   plt.show()

语句⓿导入pandas库,并给它起别名pd,导入Matplotlib库的pyplot子模块,并给它起别名plt;语句❶是设置中文字体;语句❷构造数据;语句❸绘制柱状图并设置标题;语句❹设置标题字号,效果如图9-14所示。

Python图形绘制:如何用Matplotlib和pandas绘图?

图9-14

plot函数也有许多参数,例如参数kind控制图表类型,将kind='bar'修改为kind='pie',图表将变为饼状图,效果如图9-15所示。

Python图形绘制:如何用Matplotlib和pandas绘图?

图9-15

2.DataFrame.plot

DataFrame是一个二维结构,除了拥有index和value之外,还拥有column。它类似于一张Excel表格,由多行、多列构成。DataFrame由多个Series对象组成,无论是行还是列,单独拆分出来都是一个Series对象。

下面以实例说明。

   import pandas as pd
   import matplotlib.pyplot as plt
   plt.rcParams['font.sans-serif']=['SimHei']
⓿ data=pd.DataFrame([[3,8],[2,6],[6,1],[5,4]], 
           index=['1季度', '2季度', '3季度', '4季度'],columns=['手机', '电脑'])   
❶ fig=data.plot(kind='bar',title='2019年各季度产品销量(单位:万台)',
           figsize=(20,16),fontsize=30)
 fig.axes.title.set_size(40)
 plt.legend(loc='best',fontsize=30)
   plt.show()

语句⓿构造了绘图所需数据;语句❶绘制图表,设置标题、图表区大小、字号;语句设置标题字号;语句设置图例字号,最后显示图表,效果如图9-16所示。

Python图形绘制:如何用Matplotlib和pandas绘图?

图9-16

9.3.3 用Python绘制词云图

使用Python不仅可以绘制统计图表,还可以绘制各种可视化图,例如文本分析常用的词云图。

词云图,也叫“文字云”,是文本中出现频率较高的“关键词”的视觉化展现。频率越高,则字体越大、越突出,也越重要。相对于柱状图、折线图、饼图等用来显示数值数据的图表,词云图可以展示大量文本数据,通过过滤掉大量的低频低质的文本信息,使浏览者只要一眼扫过文本就可领略文本的主旨。

制作词云图要使用的库有:jieba、wordcloud、numpy、PIL、matplotlib。它们的安装方法都非常简单,直接用pip命令安装即可。

下面我们通过爬虫抓取电影《我们的未来》豆瓣点评,并制作点评文字的词云图。

⓿ import numpy as np
   import jieba
   from PIL import Image
   from wordcloud import WordCloud, STOPWORDS
   import matplotlib.pyplot as plt
❶ with open(r'H:\示例\第9章\影评.txt', 'rb') as f:
       text=f.read()
 words=jieba.cut(text)
   wordstr=' '.join(words)
 wordcloud=WordCloud(font_path='H:\示例\第9章\msyh.ttf', 
       mask=np.array(Image.open(r'H:\示例\第9章\background.png')),
       width=600, height=600, max_words=100, max_font_size=80,
       stopwords=set(STOPWORDS),scale=4,background_color='white')
❹ wordcloud.generate(wordstr)
❺ wordcloud.to_file(r'H:\示例\第9章\wordcloud.png')

语句⓿引入必要的库文件;语句❶打开影评文件,读取文本;语句使用jieba分词,将文件分割为词语;语句设置词云图,如字体、背景(mask)、宽、高、最大字数、最大字号、停用词(排除词列表,即不显示的单词列表,如助词等)、缩放、背景颜色等;语句❹导入词语,生成词云图;语句❺将生成的词云图保存到本地。

打开词云图,效果如图9-17所示(略)。

本文摘自《学Python,不加班——轻松实现办公自动化》

Python图形绘制:如何用Matplotlib和pandas绘图?

这是一本关于如何利用Python提高日常办公效率的书,书中凝聚了作者多年的实践经验和独特思考,旨在帮助读者准确、高效地完成大量高重复度的工作。

本书汇集了日常办公和处理文档时常见的问题,通过实例的演示与讲解,帮助读者灵活有效地使用Python处理工作中遇到的问题。全书共11章,涵盖Python的各种应用场景,具体包括文件管理自动化,网络信息自动获取,TXT、XLS/XLSX、DOC/DOCX、PPT、PDF、图片文件的自动化处理,模拟鼠标、键盘操控本地软件,自动化运行管理等。本书力图淡化编程中的抽象概念,贴合工作场景,注重实战效果,通过对Python技术的巧妙讲解,帮助读者成为高效率的办公室“超人”。

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值