一、概念
箱式图是用来描述数据的分布趋势的一种是可视化图表类型。其主要组成部分是最大值、最小值、四分之一位数、四分之三位数以及离散值。通过绘制箱式图,可以清楚地得知数据分布的趋势以及数据之间的相互关系。
二、代码
### Python代码
>>> import numpy as np
>>> import pandas as pd
>>> import matplotlib.pyplot as plt
>>> data = {
... 'China': [1000, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2500],
... 'America': [1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100],
... 'Britain': [1000, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000],
... "Russia": [800, 1000, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900]
... }
>>> df = pd.DataFrame(data)
>>> df.plot.box(title="Consumer spending in each country")
<AxesSubplot:title={'center':'Consumer spending in each country'}>
>>> plt.grid(linestyle="--", alpha=0.3)
>>> plt.show()
输出结果如下:
注释:python代码主要使用到了pandas库和matplotlib库,其中pandas用于简单的数据处理,即将数据格式转换为dataframe的格式,之后通过matplotlib的可视化模块导出为图像。
### R代码
set.seed(1)
boxplot(rnorm(10),rnorm(10),names = c("rn1","rn2"),col = colors()[10:11])
输出结果如下:
注释:在R中主要用到了随机数生成函数和boxplot函数。前者用于生成所用的数据,保存为矩阵对象,后者用于进行数据处理以及图表绘制。
三、参考