引用
- 数据分析之---Python可视化工具
- 如何选择正确的图表类型
- 数据可视化:你想知道的经典图表全在这
- 如何快速成为数据分析师?
- 50个matplotlib可视化 - 主图(带有完整的python代码)(1)
- Matplotlib 简介
- python开发大全、系列文章、精品教程
- python数据可视化系列教程——matplotlib绘图全解
一. 统计方法
python lib: numpy
- 平均值、最大值、最小值、求和
- 标准误差:表示样本平均数和总体平均数的变异程度,可以用来反映结果精密度。
- 标准差(均方差):计算一组数据偏离均值的平均幅度,不管这组数据是样本数据还是总体数据
- 方差:在概率论和统计方差衡量随机变量或一组数据时离散程度的度量
- 中位数:对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。
- 众数:在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)
import numpy as np
from scipy.stats import mode
array = np.array([1, 3, 4, 23, 565, 1, -8, 123, 111, 54, 45.0, 3, 3])
print '求和:', array.sum()
print '最大值:', array.max()
print '最小值:', array.min()
print '条数:', array.size
print '标准差:', array.std()---------------偏离平均值的幅度
print '平均值:', array.mean()
print '中位数:', np.median(array)
print '方差:', np.var(array)---------------这组数据离散程度
print '众数:', mode(array).mode, mode(array).count
二. 图表
数据通常包含五种关系:构成、比较、趋势、分布及联系。
- 构成:关注每个部分所占整体的百分比,适用饼图。
- 比较:展示事物的排列顺序,首选条图。
- 趋势:常见的时间序列关系,适用线图能更好的展示变化。
- 分布:关心各数值范围包含多少项目,适用柱图。
- 联系:查看两个变量之间关系,适用气泡图。
三. 可视化
python lib:matplotlib、Pandas、Seaborn、ggplot、Bokeh、pygal、Plotly