统计学
刚搬完砖
公众号: 刚搬完砖
搬砖之后,关于自然语言处理技术/推荐技术的一些总结与思考
展开
-
统计学中常见的英文缩写
在看英文概率书籍时候遇见上述词汇,概念有所不清,下面我总结下pmf:离散随机变量的概率密度函数,也有人翻译为概率质量函数。常见形式: Cpmf:就是离散随机变量的累积分布函数,不连续。Pdf:连续随机变量的概率密度函数,常见形式如高斯概率密度函数。 Cdf:连续随机变量的累积分布函数(分布函数)。就是对pdf的积分,形式如: Corelation coefficient:相关系数。如下式:原创 2015-08-29 17:15:41 · 20080 阅读 · 0 评论 -
Dummy variable (变量dummy化)
总是可以从身边同学口中听到说到dummy化,dummy lr, 今天自己看了dummy variable的wiki,这里记下笔记总结:dummy variable是用0或1表示某个类别是否出现为什么要dummy化 若用数字1-12表示1-12月,那么就潜在表示了12月和1月差的很远,其实离的很近若用离散数字表示一地域,假如用数字1-23表示23个省,那么数字潜在的意思是,相邻的数字代表的省比原创 2015-09-26 21:21:42 · 38948 阅读 · 1 评论