机器学习基础
文章平均质量分 75
qq_35286745
这个作者很懒,什么都没留下…
展开
-
information theory——熵
熵用来度量一个事件、一个变量取值所含有的信息的量的大小。出发点:一个低概率事件发生——背后信息大;反之亦然。比如,找人算1+1,等于2是很显然的,但是某人算出个3出来,那背后就有很大空间可以让我们想象了。实施:既然信息量和概率(以及发生)有关,那就从事件发生的概率角度度量信息量;p(x) 设信息量用h(·)来表示 低概率事件信息量>高概率事件原创 2017-09-08 01:51:41 · 306 阅读 · 0 评论 -
统计学中的 DATA:Nominal,Ordinal, Interval and Ratio怎么区别
1) Norminal Data 定类变量:变量的不同取值仅仅代表了不同类的事物,这样的变量叫定类变量。问卷的人口特征中最常使用的问题,而调查被访对象的“性别”,就是 定类变量。对于定类变量,加减乘除等运算是没有实际意义的。(2) Ordinal Data定序变量:变量的值不仅能够代表事物的分类,还能代表事物按某种特性的排序,这样的变量叫定序变量。问卷的人口特征中最常使用的问题“教育程度“转载 2017-09-08 16:16:09 · 30979 阅读 · 0 评论