gridview 在已有数据的基础上添加数据_数据科学 | 算法工程师必备的数学基础(上)...

1e905298295e3e5cfb0e723de0589ad9.png

作者:华校专

华校专,曾任阿里巴巴资深算法工程师、智易科技首席算法研究员,现任腾讯高级研究员,《Python 大战机器学习》的作者。

编者按

对于想要了解模型的底层逻辑,优化算法性能的工程师,线性代数、高等数学、概率论都是必备的基础知识。作者以浅显的语言,深入浅出的总结了算法中涉及的主要数学知识,对于工作中速查和深入学习都大有裨益。

线性代数和概率论,是算法的基础知识。掌握这些知识,对于公式推导及算法理解大有裨益。

我们在计算损失函数时,一般需要加入正则化的范数项,那么范数的计算公式还记得么?

线性代数

一、基本知识

1.本书中所有的向量都是列向量的形式:

ba9e648d8fee79dd1cddb11e01f9de16.png

92bec9bf1c39a80400645fa1a6f935f6.png

3e59f43cf1dc5cdbdb76ccde961616d8.png

过滤算法中的欧氏距离和余弦相似度是如何计算的?

二、向量操作

422d4c5055796fddd263635fc00ee5e9.png

df60d4e8ef98cc1995751ff5ae1537a7.png

熟悉下贝叶斯估计的基本假设:独立同分布。

概率论与随机过程

一、概率与分布

1.1 条件概率与独立事件

9d7184bb9c1766f59ab02e7b5d57a519.png

特征工程中的相关性系数与协方差计算,你还记得多少?

二、期望和方差

2.3 协方差与相关系数

1.对于二维随机变量 (X,Y) ,可以讨论描述 X 与 Y 之间相互关系的数字特征。

6dfce325630b31bd837b81f31e99b73a.png

114f3c042dcfc81a509f254cc058202d.png

ea98004fc3ead3a1e38d4a733a1e8d0f.png

常见的概率分布,你还记得几种?

五、常见概率分布

5.1 均匀分布

5580cde0b9bc6c126656e4b086530ee8.png

e067788014d75dcd4301e4d930c76ae1.png

5.4 高斯分布

正态分布是很多应用中的合理选择。如果某个随机变量取值范围是实数,且对它的概率分布一无所知,通常会假设它服从正态分布。有两个原因支持这一选择:

建模的任务的真实分布通常都确实接近正态分布。中心极限定理表明,多个独立随机变量的和近似正态分布。

在具有相同方差的所有可能的概率分布中,正态分布的熵最大(即不确定性最大)。

以上如想阅读全文,请点击以下链接:

线性代数

(http://www.huaxiaozhuan.com/%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/chapters/1_algebra.html

概率论与随机过程(http://www.huaxiaozhuan.com/%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/chapters/2_probability.html)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值