![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数学
张之海
硕士毕业于东北大学,现就职于北京某猫头鹰公司,大数据工程师职位。
展开
-
方差、标准差、均方根误差、平均绝对误差的总结
单纯介绍概念不易理解,所以应从实际应用出发介绍其区别。 四者的研究对象和研究目的不同。 概念: 1. 方差 定义: 公式: 2. 标准差(std —— Standard Deviation) 别名:均方差(mean square error)、标准偏差、实验标准差。 定义:标准差是观测值与其平均数偏差的平方和的平方根,即方差的算术平方根。 公式: 公式意义:所有数减去其...原创 2018-08-26 11:29:04 · 47253 阅读 · 3 评论 -
自由度(为什么样本方差自由度是n-1)
为什么样本方差自由度(分母)为n-1一 概念、条件及目的概念 要理解样本方差的自由度为什么是n-1,得先理解自由度的概念: 自由度,是指附加给独立的观测值的约束或限制的个数,即一组数据中可以自由取值的个数。成立条件 所谓自由取值,是指抽样时选取样本,也就是说:只有当以样本的统计量来估计总体的参数时才有自由度的概念,直接统计总体参数时是没有自由度概念的。...原创 2018-08-27 10:28:27 · 58167 阅读 · 1 评论 -
数学期望
定义 可以用两种方式给予解释: (1)离散概率 试验中每次可能的结果乘以其结果概率的总和。 (2)连续分布函数 如果X是在概率空间(Ω,P)中的随机变量,那么它的期望值E[X]的定义是: F-分布函数 并不是每一个随机变量都有期望值的,因为有的时候这个积分不存在。 (3)抽样 随机试验在同样的机会下重复多次,所有那些可能状态平均的结果。别名 数学中:数学期望值、数学期望、...原创 2018-08-27 10:46:04 · 2329 阅读 · 0 评论 -
主成分分析
1 主成分分析的步骤在详述主成分分析之前,需要像语文阅读理解那样,通读全文(不用关注细节),知道这个方法要干什么,有什么计算步骤。原创 2018-09-04 20:19:09 · 1118 阅读 · 0 评论 -
协方差、相关系数(Pearson 相关系数)
概念:Pearson相关系数 (Pearson CorrelationCoefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。[1] 注: 【定距变量】[2][3] 若想理解定距变量,需要与其他变量类型进行比对。 统计学依据数据的计量尺度将数据划分为四大类 ,即定距型数据、定序型数据、定类型数据和定比型数据。 1. 定距型数据是...原创 2018-08-30 10:41:16 · 66867 阅读 · 3 评论 -
中心化和标准化
1 为什么会谈到中心化和标准化呢?因为在阅读《推荐系统》一书,学习“改进余弦相似度”和“Pearson”相关系数时,都谈到了减去均值(当然两者中用到的,是不同的均值)。这便是“中心化”,至于标准化,是在搜索中心化的内容附带学习的,以这种比较的方式拓展知识面,也是比较有效的。2 中心化和标准化是什么?—— 定义3 为什么要提出中心化和标准化的方法?4 中心化和标准化的实际应用有哪些?...原创 2018-09-03 20:55:01 · 9341 阅读 · 2 评论 -
随机变量及其分布
随机变量XXX的概率分布,指的是它的分布函数。进一步的XXX是连续型随机变量,指的是它的概率密度。XXX是离散型随机变量,指的是它的分布律。1 均匀分布随机变量XXX落在(a,b)(a,b)(a,b)中任意位置的概率是相同的。f(x)=1b−a,a<x<bf(x) = \frac{1}{b-a},a<x<b f(x)=b−a1...原创 2019-04-18 09:26:05 · 7887 阅读 · 1 评论 -
参数估计、点估计、极大似然估计
1 为什么提出极大似然估计?(极大似然估计的来源)1.参数估计随机变量XXX的分布函数已知,但它的一个或多个参数未知,我们需要根据已有样本,估计XXX分布函数的参数。2. 点估计随机变量XXX的分布函数已知,但它的一个或多个参数未知,根据XXX的一个样本估计总体未知参数的问题称为参数的点估计问题。3. 极大似然估计...原创 2019-04-19 09:01:28 · 3627 阅读 · 0 评论