推荐引擎/人工智能
葑岚
网络广告的精准推荐,海量数据的分布式计算http://weibo.com/larryspace
展开
-
社会化推荐系统浅析-概述
对于每个人来说现实生活中充满了各种选择,买什么样的牙刷,中午吃什么,买一件什么样的衣服等等,当然你也会收到各种各样的推荐,甚至是垃圾信息的轰炸,所以在这种环境下你一定想要一个智能的贴合你的喜好的推荐。除了你自己还有一些人对你的选择同样充满兴趣,那就是广告商。传统的广告:希望通过不断重复广播的形式来改变你的喜好。基于网络的智能广告:更友好,更有效,通过定位你的喜好,来推荐一些你希望的东西原创 2012-03-12 15:04:54 · 1633 阅读 · 0 评论 -
社会化搜索与推荐浅析-常见推荐算法的比较和浅析
collective filtering(协同过滤)Item based:适用与用户数量远大与条目数量,电商用的比较多优点是:相较与基于用户来说速度快,找到的商品相似度高缺点是:也是找到的商品相似度高,很难发现用户潜在喜欢的东西User based:适用与条目不断更新的,比如链接推荐,社交类网站也经常用次方法找到用户的相似用户优点:能够找到用户可能喜欢的条目,且多样化缺点:原创 2012-03-16 17:59:41 · 3670 阅读 · 0 评论 -
社会化搜索与推荐浅析-大数据下的实时搜索
本文由larrylgq编写,转载请注明出处:http://blog.csdn.net/larrylgq/article/details/7399237作者:吕桂强邮箱:larry.lv.word@gmail.com 当我们的数据大到一定的程度,无法通过RDBMS来处理时一般的做法是使用RPC/http+索引服务器+数据库来实现通常的做法是:使用cron等定期到数据库原创 2012-04-09 16:29:42 · 1835 阅读 · 1 评论 -
社会化推荐系统浅析-皮尔逊相关系数的java实现
本文由larrylgq编写,转载请注明出处:http://blog.csdn.net/larrylgq/article/details/7395261作者:吕桂强邮箱:larry.lv.word@gmail.com相关系数的值介于–1与+1之间,即–1≤r≤+1。其性质如下:当r>0时,表示两变量正相关,r负相关。当|r|=1时,表示两变量为完全线性原创 2012-03-13 22:16:21 · 4015 阅读 · 2 评论 -
社会化搜索与推荐浅析-小例子说明什么是贝叶斯及证明过程
本文由larrylgq编写,转载请注明出处:http://blog.csdn.net/larrylgq/article/details/7395261作者:吕桂强邮箱:larry.lv.word@gmail.com贝叶斯:突破在于将先验概率转换成后验概率,但是原理很简单经典例子一:一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,原创 2012-03-23 11:51:43 · 2241 阅读 · 0 评论 -
社会化搜索与推荐浅析-朴素贝叶斯+laplace平滑文本分类器推导过程及java版实现
本文由larrylgq编写,转载请注明出处:http://blog.csdn.net/larrylgq/article/details/7395261作者:吕桂强邮箱:larry.lv.word@gmail.com朴素贝叶斯文本分类器用处挺广的,但是网上很少有实现demo,所以写了个java的实现小demo朴素贝叶斯分类用于文本分类的正式定义如下: 1、设原创 2012-03-26 18:28:44 · 8297 阅读 · 3 评论 -
社会化推荐系统浅析-社会化推荐系统和传统搜索的区别及当前现状随谈
传统搜索引擎其实是含有用户推荐成分的, google的PageRank算法是"民主的链接选举", 通过大大小小的建站者们对链接的引用, 决定链接的排名, 同时通过终端用户的点击行为, 再次调整链接排名.传统搜索引擎不含任何社交成分.社交+推荐 ,代表性的网站是微博, Pinterest和蘑菇街,它们首先都具有社交网站的典型特征:关注,粉丝,喜欢.在推荐上就各有不同了:微博是通过社交原创 2012-03-14 14:36:09 · 2152 阅读 · 1 评论 -
社会化推荐系统浅析-欧几里德距离的java实现
欧几里德距离是一个简单的相似度评价方法,返回0-1的值代表互相之间的相似度,1为完全相似上代码:package com.Social.cbra;import java.util.HashMap;import java.util.Iterator;import java.util.Map;import java.util.logging.Logger;/** * *原创 2012-03-13 15:57:45 · 1984 阅读 · 1 评论 -
社会化搜索与推荐浅析-聚类与分类
分类与聚类的主要区别在于:分类算法中,类别是已知的,类别数不变;而聚类中,类别是未知的,类别数不确定。分类需要依赖先验概率,把所有的数据点所组成的空间进行划分,组成一个个不同类别的集合,这些集合通常是不重合的 聚类:没有先验知识,属于无监督学习 适用与多维度,连续变量,基本的思路是概念建模和迭代优化 凝聚型层次聚类算法: 1:定义初始树,类似与B+树,所有数据都原创 2012-03-23 11:50:09 · 1738 阅读 · 0 评论 -
8 个基于 Lucene 的开源搜索引擎
转载自http://www.oschina.net/news/25408/searchengines-built-on-luceneLucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...Apache SolrSolr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个转载 2012-02-07 12:14:23 · 1316 阅读 · 0 评论 -
理解lucene内几个核心概念
核心索引类:IndexWriter创建一个新的索引并且添加文档到一个已有的索引中,可以对索引进行增删改操作,但是不能查找。Directory:Lucene 索引的存放位置,是一个抽象类实现类: FSDirectory:在文件系统的目录中创建索引 RAMDirectory:在内存中创建索引Analyzer:分词器,在 IndexWr原创 2012-03-19 16:00:52 · 1403 阅读 · 0 评论 -
社会化搜索与推荐浅析-智能web浅析
web的现状:大多数的传统web应用是不智能的,特点就是对所有用户的输入的反馈是相同的。所需要做的是:系统在反馈之前先考虑用户的所有行为,和所有用户在不同时间的行为,及其它各种可能有用的信息进行分析。web智能的基本要素:内容聚合:即与具体应用相关的大量的数据参考结构:内容的结构化和语义解释算法:获得数据中隐藏的信息智能推荐所要注意的地方:1:数据是否可信规范不原创 2012-03-15 22:22:22 · 1637 阅读 · 2 评论 -
数据挖掘的一些基本概念
建模方法:1:数据汇总: eg:pagerank 通过数据来反映网页的重要性,即随机一个用户处于该页的概率2:聚类3:特征抽取 1:频繁项集 frequent itemset: eg:大多数用户买A的同时也购买了B,则当有用户买A的时候给他推荐B 2:相似项 similar item原创 2013-01-05 10:31:25 · 2734 阅读 · 0 评论