hadoop常用的框架

Hadoop总结:

MapReduse:对数据的处理,数据主要来自于hdfs

Hdfs(Hadoop Di):hadoop 的分布式文件系统,相当于win的资源管理器,储存与管理文件

Nutch:浏览器的简称

Unstructured  Date:非结构化的数据,常见的有log日志,包含Flume与Scribe(能收集数据),可以用来收集数据

Structured Date:结构化的数据,是关系型数据库的形式,常用的数据库(Oracle,Mysql,SqlService)包含:hiho与sqoop框架,需要命令导出,可以使用命令导出

JAQL:可以使用一句sql把数据导出来

Hive:

Hbase(OLTP---on-line transaction processing的简写) 在线交易过程,联机事务处理 ; 使用时一般数据到达TB级的,响应的时间可以达到秒级别。

MyEclipse:利用java代码操作hadoop

More High Level Interfaces(mahout):封装了很多的算法,只需要输入与运行时的参数。例如分类的算法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

盒马coding

你的支持是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值