正态分布最通俗的解释---今天你正太分布了吗?

正态分布这一现象有多重要?可以说我们的生活中随处都可遇见,只是没有被人留意。但是当你接触机器学习的时候,正态分布是你无法避开的话题。既然这么重要,我决定写一篇文章介绍一下正太分布,当然里面整理了一些网上的说法,后面我会标识出来。

本文我会遵照以下思路展开:
1,生活中正态分布的现象;
2,正态分布名字的由来;
3,为什么机器学习中要经常用到正态分布?
let’s go!

生活中的正态分布现象

现象一:
记得我在上高中的时候,成绩大概是班级15名附近。每次考试结束的时候都会和同桌讨论答案。情况如下图所示:
在这里插入图片描述
大家看,这个情况是不是很熟悉,每次考试,不管你对完答案心情如何,结果都差不多,成绩并没有大幅度变化。(当然会有个别猛人逆袭,不过逆袭的都是个别人,这也符合正太分布的规律。正太分布什么规律?别急,后面会跟大家介绍)

现象二:
我家住在城西,我在城东上班。我每天预留50分钟的上班世间,有时候我20分钟就到单位了,有时候会用到接近50分钟。但是平均下来大概是30分钟,且大多数时候都在25-35分钟之间。这个规律也符合正太分布

现象三:
在这里插入图片描述
还记得我们上学拍合照吗?去掉几个特别高的和几个特别矮的,大部分人的身高是差不多的。不是吗?这也符合正太分布的规律。

正太分布名字的由来

关于正太分布的小实验
正太分布这个现象可以说历史悠久,但是人们研究这个现象却是有迹可循的。

考虑一个预测模型,该模型可以是我们的数据科学研究中的一个组件。

如果我们想精确预测一个变量的值,那么我们首先要做的就是理解该变量的潜在特性。

首先我们要知道该变量的可能取值,还要知道这些值是连续的还是离散的。简单来讲,如果我们要预测一个骰子的取值,那么第一步就是明白它的取值是1 到 6(离散)。第二步就是确定每个可能取值(事件)发生的概率。如果某个取值永远都不会出现,那么该值的概率就是 0 。

事件的概率越大,该事件越容易发生。

在实际操作中,我们可以大量重复进行某个实验,并记录该实验对应的输出变量的结果。

我们可以将这些取值分为不同的集合类,在每一类中,我们记录属于该类结果的次数。例如,我们可以投10000次骰子,每次都有6种可能的取值,我们可以将类别数设为6,然后我们就可以开始对每一类出现的次数进行计数了。

我们可以画出上述结果的曲线,该曲线就是概率分布曲线。目标变量每个取值的可能性就由其概率分布决定。

一旦我们知道了变量的概率分布,我们就可以开始估计事件出现的概率了,我们甚至可以使用一些概率公式。至此,我们就可更好的理解变量的特性了。概率分布取决于样本的一些特征,例如平均值,标准偏差,偏度和峰度。

如果将所有概率值求和,那么求和结果将会是100%。

世界上存在着很多不同的概率分布,而最广泛使用的就是正态分布了。

正太分布名字的由来

这要从发明这个东东的人说起。

维多利亚时期的学者Francis Galton对数据分布很着迷,他制造了一台可以产生‘数据分布’的装置。他发现这种装置适用于很多数据,他将其命名为‘正态分布’(The Normal Distribution)。
该装置名称为高尔顿钉板,如下图所示:
在这里插入图片描述

为什么机器学习中要经常用到正态分布

正太分布的含义
我们先来看一张经典的数据分布图像
在这里插入图片描述
上图代表的是正太分布的数据,数值分布的形式。
其中 N N N是这一组数据的平均值, ± σ ±σ ±σ代表这组数据的分布范围。这个图的意思是说,有接近68%的数据分布在 N ± σ N±σ N±σ之间,有95.4%的数据分布在 N ± 2 σ N±2σ N±2σ之间,有99.7%的数据分布在 N ± 3 σ N±3σ N±3σ之间。我们可以认为几乎所有数据都分布在 N ± 3 σ N±3σ N±3σ之间。

这一点很重要,这样我们可以很容易锁定数据的取值区间。

机器学习用正态分布的意义
实际上存在很多不同的分布形式,但是如果我们将大量具有不同分布的随机变量加起来,所得到的新变量将最终具有正态分布。

服从正态分布的变量总是服从正态分布。 例如,假设 A 和 B 是两个具有正态分布的变量,那么:
A x B 是正态分布
A + B 是正态分布
因此,使用正态分布,预测变量并在一定范围内找到它的概率会变得非常简单.

部分内容参考自博客
机器学习中,正态分布为何如此重要?

  • 10
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

三景页三景页

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值