基础知识
文章平均质量分 51
小八一的梦想
摸索中
展开
-
协作型过滤算法原理
协作型过滤算法(转载自: http://blog.csdn.net/huagong_adu/article/details/7362908)一、协同过滤算法的原理及实现协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算...转载 2018-05-11 09:40:16 · 1123 阅读 · 0 评论 -
集体智慧编程_2推荐系统
1)协作型过滤(见上一篇博客)2)收集偏好(python中用嵌套的字典表示)dic = {key:{key :{key{...}}}}3)寻找相近用户1.欧几里得距离物品以及用户对物品的偏好作为x,y,将用户映射到坐标轴上,计算用户之间的距离,距离越短,用户偏好越相似2.皮尔逊相关度(数据不规范):判断两组数据与某一直线拟合程度的一个度量3.曼哈顿距离4.Jaccard距离和Dice系数(两个集合...原创 2018-05-11 10:15:51 · 310 阅读 · 0 评论 -
集体智慧编程_5优化
优化技术擅长处理:受多个变量影响,存在许多可能解的问题,以及结果因这些变量的组合而产生很大变化的问题。文章一共例举三个例子:1)制定旅游组团计划;2)基于人们的偏好分配有限的资源;3)用最少交叉线来可视化社会网络。0 优化算法随机搜索(评估其他算法的基线)函数有两参数:Domain(二元祖的列表,指定每个变量最大最小值,题解长度与列表长度一致)、costf(成本函数)爬山法先从一个随机的时间安排开...原创 2018-05-18 10:27:33 · 223 阅读 · 0 评论 -
集体智慧编程_3发现群组
监督式学习与非监督式学习监督式学习指的是你拥有一个输入变量(x)和一个输出变量(Y),使用某种算法去学习从输入到输出的映射函数。例如,神经网络,决策树,支持向量机以及贝叶斯过滤等非监督式学习指的是我们只拥有(X)但是没有相关的输出变量。例如,聚类,非负矩阵因式分解,自组织映射等大概结构:有监督学习(分类,回归)↕半监督学习(分类,回归),transductive learning (分类,回归)↕...原创 2018-05-12 11:02:17 · 175 阅读 · 0 评论 -
集体智慧编程_6文档过滤
0 简述 早期的垃圾分类都是基于规则的分类器,缺点 :1)垃圾信息制造者知道规则后,可以轻松避开 ;2)是否为垃圾信息很大程度上因其所面对的读者和张贴位置的不同而不同。1 文档和单词 将构造的分类器须利用某些特征来对不同的内容项进行分类。所谓特征,是指任何可以用来判断内容中具有或是缺失的东西。当考虑对文档分类时,内容则是文档,特征则是文档中的单词。 python中的re包来处理(正...原创 2018-05-21 14:23:23 · 254 阅读 · 1 评论