集体智慧编程
文章平均质量分 77
阿泽的学习笔记
微信公众号:阿泽的学习笔记
展开
-
集体智慧编程——协同过滤
目录 1. 基于用户的协同过滤 1.1 相似度评价值 1.1.1 欧几里得距离: 1.1.2 皮尔逊相关度: 1.1.3 曼哈顿距离算法 1.1.4 Jaccard系数 1.1.5 余弦相似度 1.2 推荐物品 2. 基于物品的协同过滤 3. 两种协同过滤比较 1. 基于用户的协同过滤 协同过滤算法通常是对一大群人进行搜索,并从中找出与我们品味想近的一小群人。算法会对...原创 2018-08-14 09:19:46 · 233 阅读 · 0 评论 -
集体智慧编程——发现群组
目录 1. 监督学习和无监督学习 2. 对博客用户进行聚类 2.1 建立单词向量 2.2 层次聚类 2.3 列聚类 2.4 K-均值聚类 3. 以二维形式展现数据 1. 监督学习和无监督学习 监督学习:利用样本输入和期望输出来学习如何预测,如:神经网络、决策树、支持向量机、贝叶斯过滤等等; 无监督学习:在一群数据中找寻某种结构,而这些数据本身并不是我们要找的答案。 2. ...原创 2018-08-14 20:55:47 · 317 阅读 · 0 评论 -
集体智慧编程——搜索与排名
目录 1. 搜索引擎的组成 1.1 数据类 1.2 查询类 1. 搜索引擎的组成 首先找到一种搜索文档的方法,可以是爬虫; 其次,为文档建立索引,表中包含文档及不同单词的位置信息; 通过查询返回一个经过排序的文档列表。 1.1 数据类 数据类包括以下内容: # 数据类 class crawler: # 初始化并传入数据库名称 def __init__(self,...原创 2018-08-15 10:57:12 · 233 阅读 · 0 评论