碧格大特 · Hadoop的横空出世

大数据,人工智能,只这几个字,就能嗨到高潮。新时代里技术较量的新战场,是谈论最多,含金量更高,嘴皮子快秃噜破皮的技术话题。CRUD的猿们都只恨自己的工位,埋没在业务代码的if else里,不能用Hadoop,spark,storm,kafka厮杀一番,小白也是熬死了发际线的男人,决定下海,去呼应碧格大特的神秘磁场。

远古时代,boss下达任务,我要看这一年我的商业帝国各个业务的销售报表,公司整体运行的情况。No Problem!咻咻咻,SQL几百行,熬夜跑几趟。不行等一会,调试我最棒。oracle,mysql,虽然慢了点,虽然SQL多了点,但是总是能在老板的咖啡泡完之前给出报表。后来,帝国版图扩大,业务激增,数据爆炸,Oracle本来是帝国的中流砥柱,奈何太贵,维护太累,mysql的集群部署,分库分表,渐渐代替了Oracle。

再后来帝国开始了高阶运营,用户的行为也要开始分析了。你的每次点击,都是我们数据库里的魔力转圈圈。好了,每天几亿,爱的魔力转了一圈又一圈。老板说,看看我的子民们都爱看什么?老板是上帝,你说啥就是啥,说干就干,拿着需求,一看几百张表,一张表几千万的数据,分析计算,真是无可奈何发落去,似曾相识一脸懵。

此刻,横空出世!!!Hadoop来了 !!!还是三件套哦,HDFS+YARN+MapReduce。

HDFS,Hadoop Distributed Filesystem, Hadoop分布式存储系统,将海量的数据分布式存储到很多台机器上。大数据的存储就这样有了解决方案。

MapReduce,分布式计算系统,并行计算模型Map/Reduce,一个一个的计算任务,分散到各个机器上。那么怎么分发,怎么计算,怎么出结果呢?

YARN,分布式资源调度系统,负责将计算任务调度和分发给各个机器去运行。

用我们万能的java去挥洒汗水,实现我们曾经几百行SQL的逻辑,作分析,出报表,不过真的很艰难,我太难了。这时候,又出现了新的一款技术神器,Hive,分布式数据仓库,他依赖于MapReduce,他的使命只有一个,将SQL翻译成MapReduce式JAVA代码,解放了双手,用双手握住简单的幸福,又可以愉快的使用熟悉的SQL去biubiubiu。

这里还有一个数据采集的技术系统,Flume,分布式日志采集系统。用户行为日志如何采集,就可以通过他写入到HDFS中。

大数据降临,分布式系统的相互协作,方可以存储,计算,分析,出报表,算指标,大boss的咖啡泡好了,报表也能稳妥的出现在老板的电脑上,不过数据量那么大,计算的速度可就没有那么称心了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值