【统计学】论统计学知识点

论统计学知识点

前言

         统计学在数据分析的基础上,研究如何测定,收集,整理,归纳和分析数据规律,以便给出正确消息的学科。它在数据挖掘,自然语言处理,机器学习中都被广泛使用,比如博主之前的那篇关于规则与统计相结合的词义消岐方法研究学习笔记,其中作者就用到了统计学。


一、 图形可视化

说明

         所谓的图形可视化就是将自己的数据利用图形(各种各种的图形)展现出来,这样对于用户来说无疑是最直观的,最具明显的来分析自己的数据。比如博主最近遇到项目上的一个关于器件价格的一个问题,就是将指定的器件按照它的购买价格,购买时间使用图形可视化(折线图),这样我们就能很“舒服”的了解这个器件的基本信息。

具有哪些图形?
  1. 饼图
  2. 条形图
  3. 热力图
  4. 折线图
  5. 箱线图
  6. 散点图
  7. 雷达图
  8. 仪表图

例如图形如下所示
饼图:
在这里插入图片描述
条形图:
在这里插入图片描述
这里就不一一列举了。
资源
在这里插入图片描述
相应的案例:
在这里插入图片描述
获取链接: https://download.csdn.net/download/jiajikang_jjk/10751628

二、数据度量标准

  1. 平均数

  2. 中位数
    说明:
    奇数 n 个数值,则中位数位置: n + 1 2 \frac{n+1}{2} 2n+1
    偶数 n 个数值,则中位数位置: n 2 \frac{n}{2} 2n

  3. 众数

  4. 期望

  5. 方差
    X是服从分布F的随机变量,如果 E ( X ) E(X) E(X) 是随机变数X的期望值(平均数u=E[X]),则随机变量X或者分布F的方差是:
    V a r ( X ) = σ 2 = ∑ E ( X − u ) 2 N Var(X)=\sigma^2=\frac{\sum{E(X-u)^2}}{N} Var(X)=σ2=NE(Xu)2
    连续随机变量
    如果随机变数X是连续分布,并对应概率密度函数 f ( x ) f(x) f(x),则方差是
    V a r ( X ) = σ 2 = ∫ ( x − u ) 2 f ( x ) d x = ∫ x 2 f ( x ) d x − u 2 Var(X)=\sigma^2=\int(x-u)^2f(x)dx=\int x^2f(x)dx-u^2 Var(X)=σ2=(xu)2f(x)dx=x2f(x)dxu2 此处 u的期望值 u = ∫ x f ( x ) d x u=\int xf(x)dx u=xf(x)dx
    离散随机变量
    如果随机变数X是具有概率质量函数的离散概率分布 x 1 → p 1 , . . . x n → p n x_1 \rightarrow p_1,...x_n \rightarrow p_n x1p1,...xnpn, 则:
    V a r ( X ) = ∑ i = 1 n p i ( x i − u ) 2 = ∑ i = 1 n ( p i x i 2 ) − u 2 Var(X)=\sum_{i=1}^{n}p_i(x_i-u)^2=\sum_{i=1}^{n}(p_ix_i^2)-u^2 Var(X)=i=1npi(xiu)2=i=1n(pixi2)u2

  6. 标准差
    方差开方就是标准差

  7. 标准分

三、概率分布

  1. 几何概率
  2. 二项分布
  3. 正态分布
  4. 泊松分布

四、统计假设检验

        假设检验是推论统计假设的一种方。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估计未知参数就会希望根据结果对未知的真正参数值做出适当的推论。假设检验的种类包括:t检验,z检验,卡方检验,F检验,等等。
这里博主只是提出知识点,并不过多深究(论述统计学的知识点)

五、相关和回归

  • 相关
    1: 正线性相关
    2:负线性相关
  • 回归
    1:最佳拟合线预测
    2:线性回归
    3:逻辑回归

总结

       以上五个部分的简单概括,都是关于统计学的相关知识点。前言也说明了关于统计学用到的范围特别的广泛。所以运用好统计学是非常重要的。

说明

本文翻译出处:《自然语言处理理论与实战》

  • 3
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 很抱歉,我无法直接呈现思维导图,但是我可以为您列出一些统计学原理的主要知识点: 1. 描述性统计 - 中心趋势:平均数、中位数、众数 - 离散程度:范围、方差、标准差 2. 概率分布 - 正态分布 - t 分布 - 卡方分布 - F 分布 3. 抽样分布 - 样本均值的抽样分布 - 样本比例的抽样分布 4. 参数估计 - 点估计 - 区间估计 5. 假设检验 - 假设检验的步骤 - 单样本 t 检验 - 双样本 t 检验 - 方差分析 - 卡方检验 6. 相关与回归分析 - 相关分析 - 回归分析 - 多元回归分析 希望这些知识点能够对您有所帮助。 ### 回答2: 统计学原理是一门研究数据收集、整理、分析和解释的学科,它提供了一种方法,可以帮助我们从大量数据中找到有意义的信息和模式。以下是统计学原理的基本知识点的思维导图。 1. 数据类型:统计学中的数据可以分为定性数据和定量数据。定性数据是描述性的,无法进行计量,如性别、民族等。定量数据是数值型的,可以进行计量和数值操作,如身高、体重等。 2. 数据收集:数据收集是统计学研究的第一步。它涉及到确定研究对象、设计实验或调查问卷,并采集数据的过程。数据收集的方法包括实验、调查、观察等。 3. 描述统计:描述统计是对数据进行总结和描述的过程,它包括中心趋势和变异程度的度量。中心趋势指示数据的平均水平,包括均值、中位数和众数等。变异程度反映数据的离散程度,包括标准差、方差等。 4. 概率:概率是事件发生的可能性。它在统计学中有着重要的应用。概率包括条件概率、独立性、概率分布等。 5. 统计推断:统计推断是根据抽样数据来推断总体参数的过程。它包括估计和假设检验。估计是对总体参数进行估计的过程,包括点估计和区间估计。假设检验是对总体参数提出假设,并根据样本数据来判断这些假设是否成立。 6. 相关和回归分析:相关分析是研究两个变量之间的关系的统计方法,它用相关系数来度量变量之间的相关性。回归分析是研究因变量和自变量之间关系的统计方法,它通过拟合一个线性回归方程来预测因变量。 7. 抽样方法:抽样方法是从总体中选择样本的方法。常见的抽样方法包括简单随机抽样、分层抽样、系统抽样等。 以上是统计学原理的基本知识点的思维导图。这些知识点涵盖了统计学的主要内容,能够帮助我们理解和应用统计学的方法和技巧。 ### 回答3: 统计学原理知识点思维导图如下: 1. 统计学基础 - 定义和目的 - 假设检验与推断 - 数据收集和整理 2. 描述统计学 - 数据的类型:定量和定性变量 - 中心趋势的测量:均值、中位数、众数 - 离散程度的度量:范围、方差、标准差 - 数据的呈现方式:表格、图表 3. 概率与概率分布 - 随机事件与样本空间 - 概率的基本性质 - 离散概率分布:二项分布、泊松分布 - 连续概率分布:正态分布、指数分布 4. 抽样与抽样分布 - 总体和样本的概念 - 抽样的方法:简单随机抽样、系统抽样、分层抽样 - 中心极限定理 - 抽样分布:t分布、χ²分布、F分布 5. 参数估计 - 点估计与区间估计 - 估计量的性质:无偏性、一致性、有效性 - 置信区间的计算与解读 - 样本量的确定 6. 假设检验 - 假设与原假设 - 显著性水平与拒绝域 - 类型I和类型II错误 - 常见的假设检验方法:正态总体均值、比例、方差的假设检验 7. 相关与回归分析 - 相关分析:皮尔逊相关系数、斯皮尔曼相关系数 - 回归分析:简单线性回归、多元线性回归 - 残差分析与模型检验 - 预测与解释变量的选择 这个思维导图涵盖了统计学原理的主要知识点,能够帮助人们系统地理解和学习统计学的基本概念和方法。通过对这些知识点的掌握,人们可以更好地理解和分析数据,并做出准确可靠的统计推断和决策。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值