直接学习:https://edu.csdn.net/course/play/6861/371101
离散型数据的可视化(二)
1、条形图的绘制
bar(x,height,width=0.8,bottom=None,color=None,edgecolor=None,tick_label=None,label=None)
x:传递数值序列,指定条形图中x轴上的刻度值
height:传递数值序列,指定条形图中y轴的高度
width:指定条形图的宽度,默认为0.8
bottom:用于绘制堆叠条形图
color:指定条形图的填充色
edgecolor:指定条形图的边框色
tick_label:指定条形图的刻度标签
label:指定条形图的标签,一般用于添加图例
2、代码如下:
import pandas as pd
import matplotlib.pyplot as plt
GDP=pd.read_excel(r'C:\Users\Administrator\Desktop\python\零基础搞定Python数据分析与挖掘\零基础搞定Python数据分析与挖掘【326789】离散型数据的可视化(一)\第10章 Python数据可视化\Province GDP 2017.xlsx')
GDP
# 设置绘图风格(不妨使用R语言中的ggplot2风格)
plt.style.use('ggplot')
plt.bar(x=range(GDP.shape[0]),# 指定条形图y轴的刻度值
height=GDP.GDP , # 指定条形图y轴的数值
tick_label=GDP.Province,# 指定条形图x轴的刻度标签
color='steelblue',# 指定条形图的填充色
)
# 添加y轴的标签
plt.ylabel('GDP(万亿)')
# 添加条形图的标题
plt.title('2017年度6个省份GDP分布')
# 为每个条形图添加数值标签
for x,y in enumerate(GDP.GDP):
plt.text(x,y+0.1,'%s' %round(y,1),ha='center')
plt.show()
升序排列
# 对读入的数据做升序排序
GDP.sort_values(by = 'GDP', inplace = True)
# 绘制条形图
plt.barh(y = range(GDP.shape[0]), # 指定条形图y轴的刻度值
width = GDP.GDP, # 指定条形图x轴的数值
tick_label = GDP.Province, # 指定条形图y轴的刻度标签
color = 'steelblue', # 指定条形图的填充色
)
# 添加x轴的标签
plt.xlabel('GDP(万亿)')
# 添加条形图的标题
plt.title('2017年度6个省份GDP分布')
# 为每个条形图添加数值标签
for y,x in enumerate(GDP.GDP):
plt.text(x+0.1,y,'%s' %round(x,1),va='center')
# 显示图形
plt.show()
水平交错条形图
HuRun = pd.read_excel('HuRun.xlsx')
# Pandas模块之水平交错条形图
HuRun_reshape = HuRun.pivot_table(index = 'City', columns='Year',
values='Counts').reset_index()
# 对数据集降序排序
HuRun_reshape.sort_values(by = 2016, ascending = False, inplace = True)
HuRun_reshape.plot(x = 'City', y = [2016,2017], kind = 'bar',
color = ['steelblue', 'indianred'],
# 用于旋转x轴刻度标签的角度,0表示水平显示刻度标签
rot = 0,
width = 0.8,
title = '近两年5个城市亿万资产家庭数比较')
# 添加y轴标签
plt.ylabel('亿万资产家庭数')
plt.xlabel('')
plt.show()