统计建模与r软件_【统计建模与R软件笔记】008 描述统计量(1)

本文介绍了R语言中用于统计建模的描述统计量,包括位置度量如均值、中位数、百分位数,以及分散程度度量如方差、标准差。还探讨了顺序统计量、权重平均以及偏度和峰度系数等概念,提供了相关函数的使用方法。
摘要由CSDN通过智能技术生成

今天我们开始来学习描述统计量吧!

位置的度量

位置的度量就是用来描述定量资料的集中趋势的统计量,常用的有均值、众数、中位数、百分位数等。

1.均值 mean( )

形式:

mean(x, trim = 0, na.rm = FALSE)

x 是对象(如向量、矩阵、数组或数据框)

trim 是计算均值前去掉与均值差较大数据的比例,缺省值为0,即包括全部数据

na.rm = TRUE 时,允许数据中有缺失数据

279b09845706d5e3b8562b850efc3feb.png

trim 的取值在 0 到 0.5 之间,表示计算均值前去掉异常值的比例。将向量 w 中的第一个数值改成 750 ,来看看 trim 参数好不好用吧!

363e04e11e9615e18382ca4eeb2d25a1.png

当 x 是矩阵或数组时,函数 mean( ) 的返回值,不是向量,而是一个数,是矩阵中全部数据的平均值。

a896b3c378ec34a1f29f37f141bba2ce.png

如果需要各行或各列的平均值,需要调用 apply( ) 函数

8978144f3c3ef372a47aac5153c4c5d7.png

如果 x 是数据框,则 mean( ) 的返回值就是向量

8d148b90f9c10ac75c705288772cb68e.png


2. sum( ) / weighted.mean( )

形式:

sum(x, na.rm = FALSE)

weighted.mean(x, w, na.rm = FALSE)

w 是数据 x 的求和权数,与 x 的维数相同

其他参数的含义见上

关系式:mean(x) = sum(x) / length(x)


3.顺序统计量 sort( )

将 n 个数据按从小到大的顺序排列为:X(1) <= x(2) <= …… <= x(n)

最小统计量为 X(1), 最大统计量为 X(n)

形式:

sort(x, partial = NULL, na.last = NA, decreasing = FALSE)

x 可以是数值、或字符、或逻辑型向量

partial 是部分排序的指标向量

na.last 是控制缺失数据的参数, na.last = NA(缺省值),不处理缺失数据;na.last = TRUE ,缺失数据排在最后;na.last = FALSE, 缺失数据排在最前。

decreasing 是逻辑变量,控制数据排列的顺序, decreasing = FALSE(缺省值),从小到大排序;decreasing = TRUE ,从大到小排序

用 sort( ) 给观测值排序

30275fc56f3cadf4844ff88286e3fd97.png

e75f6fafa26a8df3358d7e722688d225.png


4.中位数 median( )

中位数的一显著特点是不受异常值的影响,具有稳健性

形式:

median(x, na.rm = FALSE)

1057047bb5ec30af3ec82f7154f3c12f.png


5.百分数 quantile( )

百分位数是中位数的推广, quantile( ) 函数计算观测值的百分数

形式:

quantile(x, probs = seq(0, 1, 0.25), na.rm = FALSE)

probs 是相应的百分位数,缺省时为( 0, 0.25, 0.5, 0.75, 1), 其中 seq(from = value_1, to = value_2, step = value_3 )

53aab174aae8ffccffa7181e31eb00ad.png


分散程度的度量

表示数据分散(或变异)程度的特征量有:方差、标准差、极差、四分位极差、变异系数和标准误等

1.方差、标准差与变异系数

以样本数据来衡量总体统计量

注:下文中的bar{x} 均为样本均值

方差公式:

030d2986ac896bdc3cbbeaffe6839c47.png

方差形式:var( )

标准差公式:

a045ac9c536fc13abc07973e096c2bde.png

标准差形式:sd( )

变异系数公式:

2a799a2ce80c5ca9749a1bedbce5327d.png

变异系数的计算需要自行编写函数来计算

17c0d8633284dc09bfa8a785bd586e11.png


2.极差、四分位极差与标准误

数据越分散,其极差越大。

公式:x(n) - x(1)

样本上、下四分位数之称为四分位差(或半极差),对具有异常值的数据来说,具有稳健性。

公式:Q(3) - Q(1)

标准误公式:

230546ee14f6840bf93be3f835a99669.png


分布形状的度量

如偏度系数和峰度系数

偏度系数 g1 公式:

05500cdce51edea618e8ff4b290d770a.png

峰度系数 g2 公式:

eda575ff397d0229a0ad1b7186c48026.png


071b41a733654ca70dc26d7ecb899f95.gif

ba952b9bbb898e69c2469ed2dc99964a.png

15eb928ca8252bc0ebea7ba1806b57eb.png 哇~今天的内容都学会啦! 是不是跟统计学很一样呢ce287c7d65de28d088fc3c29465b1c20.gif 597c27294d93173e59812443626d94d5.png 15eb928ca8252bc0ebea7ba1806b57eb.png 对呀!小编下一节会将啥咧? 下一节咱们用图来描述数据咋样?够高 level 吧ce287c7d65de28d088fc3c29465b1c20.gifce287c7d65de28d088fc3c29465b1c20.gif

597c27294d93173e59812443626d94d5.png

15eb928ca8252bc0ebea7ba1806b57eb.png 哇塞酷炫!盘他!! c19e2bf82634da1451235159c5285750.png 扫码关注一个吧~~ dce6bc2dbce855a88e0c7b780d54e68a.png
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
第1章 概率统计的基本知识 1.1 随机事件与概率 1.1.1随机事件 1.1.2 概率 1.1.3 古典概型 1.1.4 几何概型 1.1.5 条件概率 1.1.6 概率的乘法公式、全概率公式、Bayes公式 1.1.7 独立事件 1.1.8 n重Bemoulli试验及其概率计算 1.2 随机变及其分布 1.2.1随机变的定义 1.2.2 随机变的分布函数 1.2.3 离散型随机变 1.2.4 连续型随机变 1.2.5 随机向 1.3 随机变的数字特征 1.3.1数学期望 1.3.2 方差 1.3.3 几种常用随机变分布的期望与方差 1.3.4 协方差与相关系数 1.3.5 矩与协方差矩阵 1.4 极限定理 1.4.1大数定律 1.4.2 中心极限定理 1.5 数理统计的基本概念 1.5.1 总体、个体、简单随机样本 1.5.2 参数空间与分布族 1.5.3 统计和抽样分布 1.5.4 正态总体样本均值与样本方差的分布 习题 第2章 R软件的使用 2.1 R软件简介 2.1.1 R软件的下载与安装 2.1.2 初识R软件 2.1.3 R软件主窗口命令与快捷方式 2.2 数字、字符与向 2.2.1向 2.2.2 产生有规律的序列 2.2.3 逻辑向 2.2.4 缺失数据 2.2.5 字符型向 2.2.6 复数向 2.2.7 向下标运算 2.3 对象和它的模式与属性 2.3.1 固有属性:mode和length 2.3.2 修改对象的长度 2.3.3 attributes()和attr()函数 2.3.4 对象的class属性 2.4 因子 2.4.1 factor()函数 2.4.2 tapply()数 2.4.3 gl()函数 2.5 多维数组和矩阵 2.5.1 生成数组或矩阵 2.5.2 数组下标 2.5.3 数组的四则运算 2.5.4 矩阵的运算 2.5.5与矩阵(数组)运算有关的函数 …… 第3章 数据描述性分析 第4章 参数估计 第5章 假设检验 第6章 回归分析 第7章 方差分析 第8章 应用多元分析(Ⅰ) 第9章 应用多元分析(Ⅱ) 第10章 计算机模拟 附录 索引 参考文献 ……
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值