数据可视化-python应用

引用


一. 统计方法

python lib: numpy

  • 平均值、最大值、最小值、求和
  • 标准误差:表示样本平均数和总体平均数的变异程度,可以用来反映结果精密度。
  • 标准差(均方差):计算一组数据偏离均值的平均幅度,不管这组数据是样本数据还是总体数据
  • 方差:在概率论和统计方差衡量随机变量或一组数据时离散程度的度量
  • 中位数:对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。
  • 众数:在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)
import numpy as np
from scipy.stats import mode

array = np.array([1, 3, 4, 23, 565, 1, -8, 123, 111, 54, 45.0, 3, 3])

print '求和:', array.sum()
print '最大值:', array.max()
print '最小值:', array.min()
print '条数:', array.size
print '标准差:', array.std()---------------偏离平均值的幅度
print '平均值:', array.mean()
print '中位数:', np.median(array)
print '方差:', np.var(array)---------------这组数据离散程度
print '众数:', mode(array).mode, mode(array).count

二. 图表

数据通常包含五种关系:构成、比较、趋势、分布及联系。

  • 构成:关注每个部分所占整体的百分比,适用饼图。
  • 比较:展示事物的排列顺序,首选条图。
  • 趋势:常见的时间序列关系,适用线图能更好的展示变化。
  • 分布:关心各数值范围包含多少项目,适用柱图。
  • 联系:查看两个变量之间关系,适用气泡图。

三. 可视化

python lib:matplotlib、Pandas、Seaborn、ggplot、Bokeh、pygal、Plotly

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值