Matplotlib图形配置--设置注释


任务描述

本关任务:掌握matplotlib设置注释的几种方法和文字坐标变换,并能够应用到图形中。

相关知识

有的时候单单使用图形无法完整清晰的表达我们的信息,matplotlib提供了文字、箭头等注释可以突出图形中重点信息。

添加注释

为了使我们的可视化图形让人更加容易理解,在一些情况下辅之以少量的文字提示和标签可以更恰当地表达信息。matplotlib可以通过plt.txt/ax.txt命令手动添加注释,它们可以在具体的x/y坐标上放文字:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import matplotlib as mpl
plt.rcParams['font.sans-serif']=['simhei']
plt.rcParams['font.family']='sans-serif'
plt.rcParams['axes.unicode_minus']=False#画图可中文
style = dict(size=10, color='gray')
#绘制图形
plt.plot([5,21,12,53,7,6,43,1,69])
#设置注释
plt.text(0, 5, "第一个点",ha='center', **style)
plt.text(1, 21, "第二个点",ha='center', **style)
plt.text(2, 12, "第三个点",ha='center', **style)
plt.text(3, 53, "第四个点",ha='center', **style)
plt.text(4, 7, "第五个点",ha='center', **style)
plt.text(5, 6, "第六个点",ha='center', **style)
plt.text(6, 43, "第七个点",ha='center', **style)
plt.text(7, 1, "第八个点",ha='center', **style)
plt.text(8, 69, "第九个点",ha='center', **style)
plt.show()

plt.text方法需要一个x轴坐标、一个y轴坐标、一个字符串和一些可选参数,比如文字的颜色、字号、风格、对齐方式等其它文字属性。这里用了ha=“center”,ha是设置水平对齐方式。其他常用参数如下:

fontsize设置字体大小,默认12,可选参数xx-small,x-small,small,medium,large,x-large,xx-large

fontweight设置字体粗细,可选参数light,normal,medium,semibold,bold,heavy,black。

fontstyle设置字体类型,可选参数normal,italic,oblique] 。

verticalalignment设置垂直对齐方式,可选参数:center,top,bottom,baseline。

horizontalalignment设置水平对齐方式,可选参数:left,right,center。

rotation(旋转角度)可选参数为:vertical,horizontal也可以为数字,数字代表旋转的角度。

alpha透明度,参数值0至1之间。

backgroundcolor标题背景颜色。

还可以通过plt.annotate()函数来设置注释,该函数既可以创建文字,也可以创建箭头,而且它创建的箭头能够进行非常灵活的配置。

import matplotlib.pyplot as plt
import numpy as np
x = np.arange(0, 6)
y = x * x
plt.plot(x, y, marker='o')
for xy in zip(x, y):
    plt.annotate("(%s,%s)" % xy, xy=xy, xytext=(-20, 10), textcoords='offset points')
plt.annotate('max', xy=(5, 25), xytext=(4.3, 15),arrowprops=dict(facecolor='black', shrink=0.05))
plt.show()

这里设置了两个注释,一个显示了点的坐标,另一个显示了最高点描述max。annotate的第一个参数为注释文本字符串,第二个为被注释的坐标点,第三个为注释文字的坐标位置。

文字、坐标变换

上面的例子将文字注释放在目标数据的位置上,有的时候可能需要将文字放在与数据无关的位置上,比如坐标轴或图形,matplotlib中通过调整坐标变换transorm参数来实现:

fig, ax = plt.subplots()
ax.axis([0, 10, 0, 10])
ax.text(1, 5, “. Data: (1, 5)”, transform=ax.transData)
ax.text(0.5, 0.1, “. Axes: (0.5, 0.1)”, transform=ax.transAxes)
ax.text(0.2, 0.2, “. Figure: (0.2, 0.2)”, transform=fig.transFigure)
plt.show()

默认情况下,图中的字符是在其对应的坐标位置。通过设置transform参数修改位置,transData坐标用x,y的标签作为数据坐标;transAxes坐标以白色矩阵左下角为原点,按坐标轴尺寸的比例呈现坐标;transFigure坐标类似以灰色矩阵左下角为原点,按坐标轴尺寸的比例呈现坐标。

编程要求

在右侧编辑器补充代码,根据函数参数file_name读取文件,统计每年births的总和并作折线图,为最高/最低出生数年份设置注释,具体要求如下:

对数据进行去空值处理;

注释文字的坐标位置为被注释的坐标点减5;

折线图的figsize为(10, 10);

图形需保存到Task2/img2/T5.png。

import matplotlib
matplotlib.use('Agg')
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import warnings
warnings.filterwarnings("ignore")
import matplotlib as mpl
def student(file_name):
    # ********* Begin *********#
    fig = plt.figure(figsize=(10,10))
    data = pd.read_csv(file_name)
    data = data.dropna(axis=0,how='any')
    data = data.groupby(['year'])[['births']].sum()
    plt.plot(data.index,data.values)
    dic = data.to_dict()
    dic = dic['births']
    maxx=max(dic,key=dic.get)
    minn=min(dic,key=dic.get)
    plt.annotate('max', xy=(maxx,dic[maxx]), xytext=(maxx-5,dic[maxx]-5), arrowprops=dict(facecolor='black', shrink=0.05))
    plt.annotate('min', xy=(minn,dic[minn]), xytext=(minn-5,dic[minn]-5), arrowprops=dict(facecolor='black', shrink=0.05))
    plt.savefig('Task2/img2/T5.png')
    plt.show()
    # ********* End *********#

代码解释

创建图形对象:

fig = plt.figure(figsize=(10,10))

这行代码创建了一个新的图形对象,并设置了其大小为10x10英寸。这确保了最终生成的图像具有足够的空间来清晰地显示数据。

读取CSV文件:

data = pd.read_csv(file_name)

使用pandas库的read_csv函数读取传入的CSV文件,并将其内容存储在data变量中。file_name参数应该是一个包含文件路径的字符串。

去除缺失值:

data = data.dropna(axis=0,how='any')

这行代码删除了data中包含任何缺失值的行。axis=0表示沿着行的方向(即垂直方向)进行操作,how='any’表示只要行中包含任何缺失值,就将该行删除。

按年份分组并求和:

data = data.groupby(['year'])[['births']].sum()

使用pandas的groupby函数按照year列对数据进行分组,并使用sum函数计算每个年份的births列的总和。这通常用于时间序列数据,以获取每个时间点的累计值。

绘制折线图:

plt.plot(data.index,data.values)

使用matplotlib的plot函数绘制折线图。data.index提供了x轴的值(年份),而data.values提供了y轴的值(出生总数)。

转换数据为字典并找到极值:

dic = data.to_dict()  
dic = dic['births']  
maxx = max(dic, key=dic.get)  
minn = min(dic, key=dic.get)

首先将data转换为字典格式,然后从中提取出births字典。接着,使用max和min函数找到births字典中值最大和最小的键,即出生数最多的年份和出生数最少的年份。

标注极值:

plt.annotate('max', xy=(maxx, dic[maxx]), xytext=(maxx-5, dic[maxx]-5), arrowprops=dict(facecolor='black', shrink=0.05))  
plt.annotate('min', xy=(minn, dic[minn]), xytext=(minn-5, dic[minn]-5), arrowprops=dict(facecolor='black', shrink=0.05))

使用annotate函数在图表上标注最大和最小值的位置。xy参数指定了标注点的位置,xytext参数指定了文本标签的位置,arrowprops参数定义了箭头的属性。

保存图表:

plt.savefig('Task2/img2/T5.png')

这行代码将绘制的图表保存为PNG格式的图像文件,文件名为T5.png,保存在Task2/img2/目录下。

显示图表:

plt.show()

最后,使用show函数在屏幕上显示图表。如果代码在支持图形用户界面的环境中运行(如本地Python环境或某些IDE),这将弹出一个窗口来显示图表。


  • 21
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值