技术源于生活

努力学习新技术

Programming Collective Intelligence笔记 - Discovering Groups

1.1.       Hierarchical Clustering使用类似于Huffman编码时的合并方式。假设有N个节点,每个节点的值都是一个向量。通过第二章介绍的寻找相似物品的公式,我们可以计算任何两个向量间的距离。把距离最小的两个向量合并,生成一个新的节点,该节点的向量值是被合并的两个节点...

2007-12-25 17:43:00

阅读数:1658

评论数:0

Programming Collective Intelligence笔记 - Making Recommendations

1.        Making Recommendations1.1.       寻找相似用户1.1.1.      Euclidean distance在计算该值时,只考虑两个用户都进行了评分的项目。每一项作为一个坐标,然后算欧几里德距离。值越小越相似。1.1.2.      Pearson...

2007-12-13 22:18:00

阅读数:1706

评论数:0

Google - 数学之美系列 - 我的小结

今天从头到尾的把吴军研究员写的数学之美系列又阅读了一遍。打算从程序员的角度,把与搜索引擎相关的内容整理一下。要做一个搜索引擎,首先就得把尽量多的网页下载回来。而为了能获得尽量多的网页,就需要对互联网进行一个遍历?这里面用到的就是图论的内容,遍历可以分为两种深度优先或广度优先。当然在遍历过程中需要标...

2007-12-10 14:07:00

阅读数:1648

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭