Data Mining
文章平均质量分 75
dreamhunter_lan
经历了一些事情,不狂了(至少现在不狂),努力学习吧
展开
-
一些常见的距离与一些常用的measure
距离具有一些性质。如果d(p1, p2)是两个点p1和p2之间的距离,则如下性质成立: (1)非负性 (a)对于所有的p1和p2,d(p1, p2)≥0, (b)当且仅当p1=p2时,d(p1, p2)=0。 (2)对称性 对于所有的p1和p2,d(p1, p2)=d(p2, p1原创 2011-06-19 10:15:00 · 2431 阅读 · 0 评论 -
Logistic Regression
一种分类算法,属于Discriminant Learning Algorithms,是这样一种类型的算法:直接计算p(y|x)(比如Logistic Regression),或者直接把一个输入判定为一种类别(比如Perceptron Algorithm);而另一种叫做Genera原创 2011-07-31 22:30:08 · 544 阅读 · 0 评论 -
通过学习p(y|x)来分类需要估计的参数个数
通过学习p(y|x)来进行分类,计算在新的x的条件下的p(y|x),然后判断x应该属于哪个类。 之前一直想不通要计算p(y|x)需要估计的参数个数,其实是这样的: 这里这假设x=(x1, x2, ..., xn),xi与y都是二元随机变量,就是xi与y都只取0和1中的一个值。原创 2011-08-10 00:50:42 · 658 阅读 · 0 评论