大数据学习——Day01(基础常识和数仓基础)

本文介绍了大数据的基础知识,包括大数据的定义、主要特点和发展历程。重点讲解了大数据处理技术中的Hadoop平台,以及数据仓库中的Hive技术。Hive是数据仓库与Hadoop结合的重要标志,用于大数据的存储和计算。此外,还提到了学习大数据所需的硬件和软件需求,如服务器集群、HDFS和MapReduce。
摘要由CSDN通过智能技术生成

大数据定义

现有技术无法处理的数据。

主要特点

  • 体量大
  • 要求处理速度快
  • 数据种类多

发展历程

数据–>存储、计算数据–>分布式计算

大数据处理技术的发展历程

  1. 谷歌提供了理论支撑:GFS、MapReduce和BigTable。
  2. hadoop:大数据处理平台,将分布式计算打包,降低了分布式编程的难度。

数据仓库

Hive

数据仓库中的一个非常重要的技术,是数据仓库与hadoop紧密结合的标志。

学习硬件需求

服务器集群(vmware,购买云服务器集群,购买服务器)

技术软件需求
  1. 存储 :HDFS
  2. 计算:Mapreduce
hadoop基础
  1. 创建目录
    hadoop dfs -mkdir /home
  2. 上传文件或目录到hdfs
    hadoop dfs -put hello /
    hadoop dfs -put hellodir/ /
  3. 查看目录
    hadoop dfs -ls /
  4. 创建一个空文件
    hadoop dfs -touchz /wahaha
  5. 删除一个文件
    hadoop dfs -rm /wahaha
  6. 删除一个目录
    hadoop
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值