![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
BallCai
IT小小鸟,奋斗中~
展开
-
浅谈搜索引擎
本来是想同时研究下搜索引擎和Hadoop大数据处理框架的,结果没想到两者也有着记得的关系。 在看了几天的文档,博客后,谈下对搜索引擎的理解,不说那么深奥的,就是浅显的理解。 1,存储网页,(只有搜索引擎里存在足够的内容,你才能搜到你想要的东西哇,之前觉得搜索引擎可以搜到所有的东西,但是其实现在存储的内容只占整个网页世界的30%不到),而这里面就用到了网络爬虫技术,爬取原创 2015-05-19 16:15:55 · 791 阅读 · 0 评论 -
MapReduce详解
在研究了几天的MapReduce框架后,发现确实是和之前的编程思路不太一样,在此先转一篇供大家学习。 3.3 新的WordCount分析 1)源代码程序 package org.apache.hadoop.examples; import java.io.IOException; import java.util.StringTokenizer; impo转载 2015-06-04 10:05:36 · 1247 阅读 · 0 评论