黑猴子的家:Hadoop的起源

2003-2004年,Google公布了部分GFS和MapReduce思想的细节,受此启发的Doug Cutting等人用2年的业余时间实现了DFS和MapReduce机制,使Nutch性能飙升。然后Yahoo招安Doug Gutting及其项目。
2005年,Hadoop作为Lucene的子项目Nutch的一部分正式引入Apache基金会。
2006年2月被分离出来,成为一套完整独立的软件,起名为Hadoop
Hadoop名字不是一个缩写,而是一个生造出来的词。是Hadoop之父Doug Cutting儿子毛绒玩具象命名的。
Hadoop的成长过程
Lucene–>Nutch—>Hadoop

总结起来,Hadoop起源于Google的三大论文
GFS:Google的分布式文件系统Google File System
MapReduce:Google的MapReduce开源分布式并行计算框架
BigTable:一个大型的分布式数据库

演变关系
GFS—->HDFS
Google MapReduce—->Hadoop MapReduce
BigTable—->HBase

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"Su Hadoop Bash: hadoop: 未找到命令" 这个错误提示通常表示你在尝试在bash shell中使用Hadoop命令行工具时,Hadoop环境没有被正确配置或者Hadoop命令的路径不在系统的PATH变量中。 Hadoop是一个分布式计算框架,用于存储和处理大数据。要解决这个问题,你可以按照以下步骤操作: 1. **确认安装**:首先,检查是否已安装Hadoop。如果没有,你需要从官方网站下载并安装适合你系统版本的Hadoop。 2. **配置环境变量**:安装完成后,你需要添加Hadoop的bin目录到系统的PATH环境变量中。在Linux或Mac系统中,可以在`~/.bashrc`或`~/.bash_profile`文件中添加一行类似于`export PATH=$PATH:/path/to/hadoop/bin`的命令,然后source该文件使更改生效。 3. **验证安装**:尝试运行`hadoop`命令,如果仍然提示未找到命令,可能是路径设置问题。可以尝试直接输入完整路径,比如`/path/to/hadoop/bin/hadoop`。 4. **Hadoop配置文件**:确认`hadoop.conf`文件中的核心配置是否正确,如`core-site.xml`和`hdfs-site.xml`,特别是`fs.defaultFS`和`hadoop.security.authentication`等关键配置。 5. **启动服务**:安装和配置完成后,确保Hadoop服务(如HDFS和YARN)已经启动。如果服务未运行,启动它们并等待它们完全启动。 6. **权限问题**:检查当前用户是否有执行Hadoop命令的权限。 如果以上步骤都尝试过还是无法解决问题,可能需要查看Hadoop的日志(通常是`hadoop.log`或`hadoop.err`),以获取更具体的错误信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值