![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
文章平均质量分 80
JimmyLoveLife
IT界不新的新人
展开
-
集体智慧编程 读书笔记 二
还是第二章, 后面内容 这部分讲了基于物品的协作过滤, 之前讲基于用户的协作过滤, 基于物品的协作过滤适用于大数据集, 因为我们可以体检对数据进行处理, 物品的变化很小,所以计算一次后,以后可以较少的修改,这部分内容比较简单,当有数据集后, 计算每种物品的topmatch 物品 def buildSimilarItems(prefs, n=10): result =原创 2014-02-12 12:47:05 · 1072 阅读 · 0 评论 -
集体智慧编程 读书笔记 三
第三章 先是讲述聚类算法,第一步工作是构建数据集,书中给了现成数据集的下载地址, 还有feed list的下载地址, 给出了利用feed list 调用feedparser 处理成博客以及相应的单词的表格, 自己实现的时候没有必要这么来做, 一个是list里好多地址连不上, 都是国外的, 看懂代码即可, 我们可以直接把数据集下载下来, 书中给的地址已经改变所以新地址应该是: 数据集:原创 2014-02-14 14:27:46 · 1176 阅读 · 1 评论 -
集体智慧编程读书笔记 三 cont
继续来看第三章, 下面是用图形显示树 首先下载 PIL, 这个库目前不支持 python 3, 下面地址上有高手改过的版本可以用: http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil 显示画图不是本书重点, 就不解释了, 就是教你怎么用PIL画图 列聚类原创 2014-02-27 11:24:46 · 741 阅读 · 0 评论