集体智慧编程
不论如何未来很美好
这个作者很懒,什么都没留下…
展开
-
欧几里德距离、皮尔逊相关度、Tanimoto
集体智慧编程正式开始了接触,第一课便是如何寻找想进用户(也就是两者的相似程度),正如大多数的推送服务一样,通过计算你和其他的用户的相似程度,给你推荐最佳匹配人认为很好的但是你还没有购买的东西。这里重点讲了三个计算相似程度的评价方法:欧几里德距离、皮尔逊相关度、Tanimoto测试数据如下:(就是嵌套字典,共7个人对使用过的商品的评价)critics={'Lisa Rose': {'L...原创 2018-07-10 17:05:11 · 4899 阅读 · 0 评论 -
分级聚类——博客分类 (画出分级聚类树状图)
《集体智慧编程》的第三章——发现组群 下面的测试数据可以在网上下载通过分级聚类的方式将数据一层一层的聚类,最终聚类为一个大的对象。画了一个样例图如下:其中将A、B、C、D、E五个对象进行层级聚类,最终的聚类步骤上面已经标出(1,2,3,4)。原理:循环遍历所有对象,利用算法计算对象点之间的距离,每次将最近的两个对象聚为一类,直到得到最终的结果。 其实在代码中...原创 2018-07-18 18:16:09 · 16059 阅读 · 1 评论 -
K-means聚类(博客聚类)
继上一篇博客使用分级聚类对博客进行聚类《集体智慧编程》,本次使用K-means方法来对博客聚类,部分代码和数据请看上一篇。K-均值聚类应该算是比较容易理解的一种算法了,我在前面学习的时候有专门的说过K-means的原理原理和实现,如果不是很理解可以可以去看看。作者使用方法和我之前的大同小异,我用的是多个组合函数对二维数据集的聚类,更容易理解和实现。本次的数据集为多维的数据集,方法也略有不同...原创 2018-07-19 18:07:56 · 529 阅读 · 0 评论 -
基于用户的协作型过滤、基于物品的协作型过滤(产品推荐)
此篇为《集体智慧编程》第二章的主要内容——利用基于用户的协作型过滤、基于物品的协作型过滤来进行产品的推荐。在此做一个总结:一、基于用户的协作型过滤:我的理解:求出所有用户与目标用户的相似度,该相似度类似于权值,相似度越高,权值越高,说明该用户对目标用户的影响越大。使用用户权值*用户物品评分,最后统计物品的和(这里还可以做一个缩放 每件物品和/权值和)。得到每件物品推荐给用户的评分。这个...原创 2018-07-14 15:51:52 · 1140 阅读 · 0 评论