大数据
_宇宙浪子_
与其遥望远方,不如说走就走~
展开
-
十道海量数据处理面试题与十个方法大总结
转自:http://blog.csdn.net/v_july_v/article/details/6279498 海量数据处理:十道面试题与十个海量数据处理方法总结 作者:July、youwang、yanxionglu。 时间:二零一一年三月二十六日 本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。 出处:http://转载 2014-09-14 17:20:24 · 527 阅读 · 0 评论 -
超强、超详细Redis入门教程
转自:http://www.h5min.cn/article/56448.htm 这篇文章主要介绍了超强、超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下 【本教程目录】 1.redis是什么 2.redis的作者何许人也 3.谁在使用redis 4.学会安装redis 5.学会启动redis 6.使用redis客户端转载 2017-12-28 12:05:08 · 470 阅读 · 0 评论 -
全文索引原理及范例
全文检索是对大数据文本进行索引,在建立的索引中对要查找的单词进行进行搜索,定位哪些文本数据包括要搜索的单词。因此,全文检索的全部工作就是建立索引和在索引中搜索定位,所有的工作都是围绕这两个来进行的。下面就逐个介绍。 建立全文索引中有两项非常重要,一个是如何对文本进行分词,一是建立索引的数据结构。分词的方法基本上是二元分词法、最大匹配法和统计方法。索引的数据结构基本上采用倒排索引的结构。转载 2016-03-25 18:06:38 · 622 阅读 · 0 评论 -
大数据时代之hadoop(五):hadoop 分布式计算框架(MapReduce)
[置顶] 大数据时代之hadoop(五):hadoop 分布式计算框架(MapReduce) 分类: hadoop 大数据2014-11-03 10:33 555人阅读 评论(1) 收藏 举报 hadoop分布式计算mapreduce输入输出格式shuffle 目录(?)[+] 大数据时代之hadoop(一):hadoop安装 大转载 2014-11-14 14:35:41 · 767 阅读 · 0 评论 -
大数据时代之hadoop(一):hadoop安装
[置顶] 大数据时代之hadoop(一):hadoop安装 分类: 大数据 hadoop2014-10-13 09:37 1022人阅读 评论(2) 收藏 举报 hadoop大数据安装eclipse插件 目录(?)[+] 1、hadoop版本介绍 0.20.2版本以前(不含该版本)的配置文件都在default.xm转载 2014-11-14 14:30:47 · 409 阅读 · 0 评论 -
大数据时代之hadoop(三):hadoop数据流(生命周期)
[置顶] 大数据时代之hadoop(三):hadoop数据流(生命周期) 分类: hadoop 大数据2014-10-15 09:38 828人阅读 评论(0) 收藏 举报 hadoop数据流生命周期 目录(?)[+] 大数据时代之hadoop(一):hadoop安装 大数据时代之hadoop(二):hadoop脚本解析转载 2014-11-14 14:33:24 · 873 阅读 · 0 评论 -
大数据时代之hadoop(六):hadoop 生态圈(pig,hive,hbase,ZooKeeper,Sqoop)
[置顶] 大数据时代之hadoop(六):hadoop 生态圈(pig,hive,hbase,ZooKeeper,Sqoop) 分类: hadoop 大数据2014-11-11 08:40 942人阅读 评论(2) 收藏 举报 hadoopzookeeperhbasehivepig 目录(?)[+] 大数据时代之hadoop(一):hadoop安转载 2014-11-14 14:36:59 · 803 阅读 · 0 评论 -
大数据时代之hadoop(二):hadoop脚本解析
[置顶] 大数据时代之hadoop(二):hadoop脚本解析 分类: hadoop 大数据2014-10-14 09:35 2125人阅读 评论(3) 收藏 举报 hadoop脚本安装启动解析 目录(?)[+] 大数据时代之hadoop(一):hadoop安装 “兵马未动,粮草先行”,要想深入的了解ha转载 2014-11-14 14:31:58 · 502 阅读 · 0 评论 -
大数据时代之hadoop(四):hadoop 分布式文件系统(HDFS)
[置顶] 大数据时代之hadoop(四):hadoop 分布式文件系统(HDFS) 分类: hadoop 大数据2014-10-20 09:46 676人阅读 评论(1) 收藏 举报 hadoop文件系统hdfs分布式文件系统 目录(?)[+] 大数据时代之hadoop(一):hadoop安装 大数据时代之hadoop(转载 2014-11-14 14:34:51 · 831 阅读 · 0 评论 -
Spark on Yarn | Spark,从入门到精通
转载声明:本文转载自「美图数据技术团队」,搜索「美图数据技术团队」即可关注。 / 为什么需要 Yarn? / Yarn的全称是Yet Anther Resource Negotiator(另一种资源协商者)。它作为 Hadoop的一个组件,官方对它的定义是一个工作调度和集群资源管理的框架。 Yarn最早出现于Hadoop 0.23分支中,0.23分支是一个...转载 2019-05-06 14:38:54 · 182 阅读 · 0 评论