在本章中,我们将学习如何在Python中生成图形和图表,同时将使用函数和面向对象的方法来可视化数据。
Python中常用的一些可视化数据包括以下几种。
Matplotlib。
Seaborn。
ggplot。
Geoplotlib。
Bokeh。
Plotly。
在本章中将使用Matplotlib可视化数据包。此外,还将学习其他有用库的编码。
1 折线图
折线图(Line Chart)是将一系列数据点通过直线连接起来的图表,它提供了一个参数对另一个参数的简单行为,常用于显示随着时间推移的趋势。可以使用折线图来比较相关的特征。
在Jupyter Notebook中生成第一张图表。
首先导入所需要的库。import matplotlib.pyplot as plt
默认情况下, Matplotlib打开新的窗口以显示结果。如果想在当前Notebook页面看到结果,可以使用如下所示的命令。%matplotlib inline
其次需要设置两个轴的数据。在x
轴上获取1~15的数据, y
轴选取平均值为50且标准差为10的随机数据。# 1~15的一维数
a = range(1,16)
#使用均值和标准差生成另一数据上的随机整数
mean = 50
sigma = 10
b = numpy.random.normal(mean, sigma, 15).astype(int)
现在,只需运行下方的绘图命令,折线图就会出现,结果如图1所示。plt.plot(a,b)
图1
也可以使用下面的代码改变线条的颜色,结果如图2所示。#定义颜色
plt.plot(a,b,color='Red')
图2
通过ls和lw变量可以改变线的类型及其宽度,结果如图3所示。#改变线的类型和宽度
plt.plot(a,b,ls='--',lw=4)
图3
通过下面的命令可以在每个数据点上添加标记,结果如图4所示。#定义标记和标记宽度
plt.plot(a,b,marker='3',mew=10)
图4
也可以绘制Pandas DataFrame中的折线图。sales_in_Delhi = [34,45,33,45,49]
sales_in_Pune = [12,13,6,14,10]
sales_in_Mumbai = [67,78,90,75,85]
sales =pandas.DataFrame({'Delhi':sales_in_Delhi,'Pune':sales_in_Pune,'Mumbai':sales_in_Mumbai})
为了绘制折线图,可以使用以下命令。 xticks和yticks用于设置数轴上的有效范围,结果如图5所示。sales.plot(xticks=range(1,5),yticks=range(0,100,20))
图5
为不同的线条定义颜色,结果如图6所示。#定义颜色选项