高中就开始学的正态分布,原来如此重要

我们从高中就开始学正态分布,现在做数据分析、机器学习还是离不开它,那你有没有想过正态分布有什么特别之处?为什么那么多关于数据科学和机器学习的文章都围绕正态分布展开?本文作者专门写了一篇文章,试着用易于理解的方式阐明正态分布的概念。

机器学习的世界是以概率分布为中心的,而概率分布的核心是正态分布。本文说明了什么是正态分布,以及为什么正态分布的使用如此广泛,尤其是对数据科学家和机器学习专家来说。

我们会从最基础的内容开始解释,以便读者们理解为什么正态分布如此重要。

目录:

  • 什么是概率分布?

  • 什么是正态分布?

  • 为什么变量如此青睐正态分布

  • 如何用 Python 查看查看特征的分布?

  • 其它分布变一变也能近似正态分布

Unsplash,由 timJ 发布。

先让我们来看一点背景知识:

1. 首先,要注意的最重要的一点是,正态分布也被称为高斯分布。

2. 它是以天才卡尔·弗里德里希·高斯(Carl Friedrich Gauss)的名字命名的。

3. 最后需要注意的是,简单的预测模型一般都是最常用的模型,因为它们易于解释,也易于理解。现在补充一点:正态分布因为简单而流行。

因此,正态概率分布很值得我们去花时间了解。

什么是概率分布?

想象我们正在自己的数据科学项目中构建感兴趣的预测模型:

  • 如果我们想准确地预测变量,那么首先我们要了解目标变量的基本行为。

  • 我们先要确定目标变量可能输出的结果,以及这个可能的输出结果是离散值(孤立值)还是连续值(无限值)。简单点解释就是,如果我们要评估骰子的行为,那么第一步是要知道它可以取 1 到 6 之间的任一整数值(离散值)。

  • 然后下一步是开始为事件(值)分配概率。因此,如果一个值不会出现,则概率为 0%。

概率越高,事件发

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值