可视化数据分析
一、线形图
二、2D图形
三、图形中注释、文字和箭头
四、3D图形
五、极坐标与雷达图
二、2D图形
线型图也是2D图形的一种
1. 直方图 hist()
用于表达一组数据的统计规律
画直方图:
1)找出一组数据中最大值和最小值 2)从最小值到最大值划分出n个区间 3)列举出划分的n个区间中每个区间里面的数据出现的频率 4)用x轴上的刻度代表n个区间,用这个区间的上柱的高度代表区间中数据出现的频率
随机生成1000个0~100的随机整数
查看最小值和最大值
最小值是0,最大值是100
查看一下图像
返回值是一个元组,元组的内容分别是:数组1代表每个区间对应的数据的频数,数组2代表区间的边
界
参数bins代表,将数据划分的区间数,默认是10,数值越大,划分越细
参数normed代表是否将频数归一化
参数color代表颜色
参数orientation代表直方图的方向,默认是vertical代表垂直方向,horizontal代表水平方向
将数据划分的区间数变为20,将频数归一化,颜色为红色,垂直方向显示
这里有一个警告,版本的问题,提示要将normed变为density,但并不影响功能
将数据划分的区间数变为30,将频数归一化,颜色为蓝色,水平方向显示
2. 条形图 bar()
条形图反映的是两个变量之间的规律
水平方向显示
垂直方向显示
3.饼图 pie()
反映的是部分统计量占整体的比例
data中所有的数据加起来大于1,饼图会被占满,每部分占饼图比例根据当前数据占所有数据总和比例来计算
data中的所有数据加起来小于等于1,则每部分占饼图的比例就是这个数据具体值如果总和小于1,饼图不能占满
占满是这样的
饼图的属性
- 标签
参数labels,代表每一块的标签- 标签距离
参数labeldistance,代表标签距离圆心的比例- 百分比
参数autopct,代表设置每一块显示的比例值的格式,如果不设置,比例不显示
%.2f%% 表示保留2为百分比小数位数- 比例距离
参数pctdistance,代表比例值到圆心比例位置
- 参数explde,代表每一块到圆心比例值
- 参数shadow,布尔值代表是否阴影
7) 参数startangle,旋转的度数
4. 散点图
正态分布
- 用柱状图
柱状图一般在统计比较少并且离散的数据
用线形图
线形图一般在统计量能够符合一个函数规律或者若干个函数规律时
用散点图
散点图反映的是两个统计量之间规律,统计量无法用柱状图或者线形图来描述
散点图也可用线形图的方式来表示
不要"线"
三. 图形中注释,文字和箭头
1.图形中的文字
在图形上添加一个文字说明
2. 箭头
图像是这样的
参数1,代表箭头上的文字;参数xytext,代表文字的位置;参数arrowprops代表箭头样式设置; 参数xy代表箭头指向的终点自定义箭头
图像时这样的