智能web技术
wustdatamining
这个作者很懒,什么都没留下…
展开
-
基于用户的推荐和基于物品的推荐
(一)基于用户的推荐原理 基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。计算上,就是将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,找到 K 邻居后,根据邻居的相似度权重以及他们对物品的偏好,预测当前用户没有偏好的未涉及物品,计算得到一个排序的物品列表作为推荐。图 2 给出了一个例子,对于用户原创 2012-06-11 15:26:57 · 5486 阅读 · 0 评论 -
网络爬虫架构分析
对于一个搜素引擎而言,首先的问题就是网络爬虫,因为只有设计出高效的下载系统,以将如此海量的网页数据传送到本地,在本地形成互联网网页的镜像备份。今天就分析一下这个架构。同样,看下边的图来分析。 处理过程如下: (1)首先从互联网页面中精心选择一部分网页,以这些网页的链接地址作为种子URL,将这些种子URL放入待抓取URL队列中。原创 2012-06-15 12:47:51 · 2253 阅读 · 0 评论 -
搜索引擎架构浅析
搜索引擎,大家日常常用到,其实本来一件挺简单的事情,但由于数据海量的原因,把本来简单的搜索架构给整的复杂了,今天就收集了一些资料,给大致整理一下。 下图是一个通用的搜索引擎架构图,我们对着图来讲: 从右边用户的角度看: (1)用户输入查询词后,引擎会首先对查询词进行分析,希望能够结合查询词和用户信息来正确推导用户的搜索意图。原创 2012-06-14 18:39:11 · 960 阅读 · 0 评论