- 博客(3)
- 资源 (4)
- 收藏
- 关注
转载 常用的相似性度量方法
在分类聚类算法,推荐系统中,常要用到两个输入变量(通常是特征向量的形式)距离的计算,即相似性度量.不同相似性度量对于算法的结果,有些时候,差异很大.因此,有必要根据输入数据的特征,选择一种合适的相似性度量方法.令X=(x1,x2,..,xn)T,Y=(y1,y2,...yn)T为两个输入向量, 1.欧几里得距离(Euclidean distance)相当于
2012-12-11 10:13:47 3887
原创 麻省理工《算法导论》公开课学习笔记【2】
这节课主要是讲了算法中用到的渐进符号和递归式的算法效率计算方法。 对于渐进符号的讲解,我吸收不多。。。主要是对主定理印象挺深,而且在之后的很多递归方法中需要用到。在此,我就把主定理的主要讲解摘录如下。主定理通常解决如下的递归表达式:递归式描述的是将规模为n的问题划分为a个子问题,并且每个子问题的规模是n/b,这里a和b是正常数。划分原问题和合并结果的代价有函数f(
2012-12-06 21:35:37 1369
转载 如何理解皮尔逊相关系数
做相似度计算的时候经常会用到皮尔逊相关系数(Pearson Correlation Coefficient),那么应该如何理解该系数?其数学本质、含义是什么?相关公式:相关链接:http://mines.humanoriented.com/classe...http://zh.wikipedia.org/wiki/%E7%9B%B...皮尔逊相关
2012-12-05 15:58:15 3739
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人