NTU 课程笔记 CV6422 Statistical Methods & Applications (1) 基本统计知识

本文介绍了统计学的基础知识,包括总体和样本方差、离散系数的概念,以及数据图示如箱式图和QQ图的使用。详细探讨了切比雪夫法则,并概述了多种随机分布,如二项分布、泊松分布、正态分布、指数分布、χ²分布、t分布和F分布,涉及它们的性质、分布表和Excel应用。
摘要由CSDN通过智能技术生成

1 总体和样本的方差

总体的方差\sigma^2=\frac{\sum^N_1(x_i-\mu)^2}{N}

样本(总体的一个子集)的方差S^2=\frac{\sum^N_1(x_i-\mu)^2}{N-1} (这里的N-1是为了无偏估计)

2 离散系数/变异系数 coefficient of variation

标准差和平均值之比

c_v=\frac{\sigma}{\mu}

一般来说,越大表示越分散

3 数据的图示

3.1 箱式图 box-and-whisker plot

3.1.1 箱式图的局限性

以下两个直方图(histogram)所表示的分布,他们有一样的箱式图 (一样的最大最小值、一样的四分之一分位【Q1】、四分之三分位【Q3】、中位数),但他们是不一样的分布

 

 ——>就如上图所展示的,此时用直方图histogram更合适

 3.2 QQ图 quantile-quantile plot

可以来表示数据是一个什么样的分布

我们令n表示样本数据个数,i表示当前数据的排序(最小的数排序为1),于是我们根据数据绘制如下图:

根据QQ图逼近的图像,可以判断数据数据哪一种分布

 4 切比雪夫法则

        对于所有的数据,已知其均值为μ标准差为s,那么对于任何大于1的k,[μ-ks,μ+ks]包含了至少1-1/k^2 比例的数据

        ——>±2标准差中有至少75%的数据

5 概率密度函数几个概念:

        离散数据的概率密度:prob mass function,pmf

        离散数据的累积概率密度:cumulative distribution function,cdf

        连续数据的概率密度:prob density function,pdf

        连续数据的累积概率密度:cumulative distribution function,cdf

6 随机变量的均值和方差

        均值:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UQI-LIUWJ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值