[036]大数据生态圈概览

本文概括了大数据生态圈的组成,包括数据产品、数据分析、数据平台、数据仓库和机器学习等方面。介绍了数据产品的应用实例,如招聘、社交、新闻和电商。数据平台涉及Hadoop、Spark等组件,数据仓库侧重数据集成与一致性,而机器学习涵盖数据挖掘、自然语言处理和深度学习。文章旨在为读者提供大数据领域的整体理解。
摘要由CSDN通过智能技术生成

接触大数据也有2年多的时间了,一直都是在一个模块一个模块的学习以及使用,有些零散,即使总结也是单模块的总结,还没有整体的总结一下,大数据生态圈并没有整体的组成概念,相信也是许多相同道路上的朋友的情况,希望这篇总结能够对朋友们有所帮助。

在学习阶段还是不断的学习新东西,总结前人的成果,站在巨人的肩上看事物,才能看的更远,慢慢向大牛靠拢,特此对大牛们表示衷心的崇敬之情。由于参考资料都是零散的摘自各个博客,文摘,参考较多,就不一一详细罗列。感谢IT行业的开源环境,开源人员的开源情怀让更多的人得以收益,并共同发展开源社区。

下面进入正题,首先列出一张大数据生态圈的分类图,你肯定对其中的某部分感觉特别的亲切,如果你对整张图都非常熟悉了,那你也真是位大牛了。
大数据生态圈分类图
上图摘自小象问答小龙-Logan 的问答,总结的非常到位

左侧是大数据的应用,包括数据产品、数据分析两部分;右侧是根基,理论基础,包括大家熟知的数据平台、数据仓库、机器学习三大部分。有了应用层才有了大数据各项技术得以施展的空间。

数据产品,我们经常用的Boss直聘、拉勾网等招聘应用,知乎、推酷等开源分享社区,网易新闻,腾讯新闻,今日头条等新闻媒体,淘宝、京东等电商平台等都有大数据应用的影子。

数据分析:则是各种日志文件,媒体流文件,用户信息,金融类信息,电信类信息等应用非常

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值