可视化分析
可视化分析概述
可视化分析是关于数据视觉表现形式的科学技术研究。
这种数据的视觉表现形式被定义为:一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
图表类型及选择
不同类型的图表适用于不同的场景,可以按适用目的来选择合适的图表类型。
图表的基本组成
Matplotlib
Matplotlib是一个Python2D绘图库,学习Python可视化绘图的起点。
图表癿常用设置
基本Plot绘图函数
图的属性设置
画布
图形
坐标轴
文本标签
标题和图例
图表绘制
选择绘图函数
根据图表展示目的,选择图的类型,选择相应的绘图函数
折线图绘制
柱形图的绘制
直方图的绘制
【直方图(Histogram ) 】又称质量分布图,是统计报告图的一种,由一系列高度不等的纵向条纹或线段表示数据分布的情况,一般用横轴表示数据所属类别,纵轴表示数量或者占比。
【主要功能】可以比较直观地看出特性的分布状态,便于判断其总体质量分布青况。可以发现分布表无法发现的数据模式、样本的频率分布和总体的分布。【应用案例】住户年龄直方图,学生身高频数分布,学生成绩分分布图
饼形图的绘制
散点图的绘制
雷达图的绘制
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# 读取数据
df1=pd.read_excel('datas.xls')
labels=df1['地区']
sizes=list(df1['销售额'])
dataLength = len(sizes) # 数据长度
# angles数组把圆周等分为dataLength份
angles = np.linspace(0, # 数组第一个数据
2*np.pi, # 数组最后一个数据
dataLength, # 数组中数据数量
endpoint=False) # 不包含终点
sizes.append(sizes[0])
angles = np.append(angles, angles[0]) # 闭合
# 绘制雷达图
plt.polar(angles, # 设置角度
sizes, # 设置各角度上的数据
'rv--', # 设置颜色、线型和端点符号
linewidth=2) # 设置线宽
# 设置角度网格标签
plt.thetagrids(angles*180/np.pi,
labels,
fontproperties='simhei')
# 填充雷达图内部
plt.fill(angles,
sizes,
facecolor='b',
alpha=0.6)
#图形展示
plt.show()