![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hadoop
文章平均质量分 69
小生-雄
在校大学生
展开
-
搜索引擎————倒排索引
倒排索引基本概念文档(Document):一般搜索引擎的处理对象是互联网网页,而文档代表以文本形式存在的存储对象,比网页来说更加广泛,比如Word,PDF,html,XML等不同格式的文件都可以称之为文档。再比如一封邮件,一条短信,一条微博也可以称之为文档。文档集合(Document Collection):由若干文档构成的集合称之为文档集合。文档编号(Document ID)原创 2016-06-17 17:23:49 · 541 阅读 · 0 评论 -
Hadoop学习之路——重新格式化HDFS的方法
重新格式化hdfs系统的方法:(1)查看hdfs-ste.xml: dfs.name.dir /home/hadoop/hdfs/name namenode上存储hdfs名字空间元数据 dfs.data.dir /home/hadoop/hdsf/data datanode上数据块的物理存储位置 将转载 2016-08-16 18:47:08 · 694 阅读 · 0 评论