一个笑话
当我还在天神公司的时候,我常常和王宇讲一个笑话:买了红的玩家还买了蓝。每当公司的领导们讨论游戏都有哪些盈利点时,我都会想起这个带有BI色彩的笑话。
09年我被阿里的人蛊惑了,申请了阿里的工程师,希望能锻炼出在海量数据中搜索有用信息的本事。自然阿里没有给我机会。不过昨天晚上我看到一个创业工程师给出的题目,突然有了一点思路。
垂直搜索
从你在某个网站的博客开始,将此网站的所有博主信息抓取到你建立的数据仓库。
数据节点网的遍历,也没有什么好说的。
好友推荐
当甲添加博主A为好友时,系统能够向甲提示,添加了博主A的用户还添加了博主B为好友。
获取博主A的好友A1,A2,A3
A1:A2,A3
A2:A1,A3
A3:A1,A1
以上保存的数据直观的表明了,添加A1为好友的人,还添加了A2和A3为好友。
海量数据检索的一个基本思想是:倒排序索引。
思考另一个问题,添加A为好友的用户都有哪些?