数据控使用Hadoop的三种最常用方式

最新推荐文章于 2024-05-04 08:21:53 发布

aa541505

最新推荐文章于 2024-05-04 08:21:53 发布

阅读量285

点赞数

分类专栏： IT资讯互联网科技人工智能大数据hadoop学习文章标签：大数据程序员编程语言 hadoop

本文链接：https://blog.csdn.net/aa541505/article/details/90300013

版权

本文介绍了数据控使用Hadoop的三种主要模式：数据精炼厂、数据探索和挖掘应用程序。数据精炼厂模式用于将大量新数据源整合到传统BI和分析系统；数据探索则直接在Hadoop上探索新数据，发现新的分析应用；挖掘应用程序则利用Hadoop中的数据定制用户体验。这些模式已在多个行业中得到应用，如金融服务、零售、电信和体育等。

摘要由CSDN通过智能技术生成

Hadoop使用的一般模式

Hadoop最初的构想是为像Yahoo、Google、Facebook等这样的公司以非常低的成本来解决大量数据的存储问题。现在，它正被越来越多地引入企业环境中处理新不同数据类型。机器生成的数据、传感器数据、社交数据、网络日志等数据类型呈指数级增长，而且这些数据也常常(但不总是)是非结构化。正是由于这种类型的数据将人机对话从“数据分析”带到大数据分析：因为挖掘这些数据可以得到商业优势。

分析应用程序以各种形式流行起来，最重要的是可以定向解决一个垂直行业的需要。乍一看，他们彼此似乎在行业和垂直上没有关系，但是实际上，当在基础设施层面观察时，会出现一些非常清晰的模式，也就是以下3种模式：

Pattern 1：数据精炼厂

使用Hadoop的“数据精炼厂”模式使组织能够将这些新数据源纳入他们常用BI和分析应用程序。例如，我可能有一个应用程序，它能够在ERP和CRM系统中查看客户建立在上面的数据。但是如何才能从他们的web session(基于我们网站)中发现他们的兴趣所在?“数据精炼厂”，这个使用模式正是顾客期望的。

这里的关键概念是Hadoop是被用来提取大量数据以便更容易管理。然后生成的数据被加载到现有数据系统，这些数据可以使用传统的工具访问，但是别忘了，这些操作都是建立在更丰富的数据集上。从某些方面来说，这是最简单的用例，因为无需对传统途径进行大的修改，企业就可以清晰的从Hadoop上获益。无论垂直与否，

最低0.47元/天解锁文章

aa541505

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据控使用Hadoop的三种最常用方式

Hadoop使用的一般模式Hadoop最初的构想是为像Yahoo、Google、Facebook等这样的公司以非常低的成本来解决大量数据的存储问题。现在，它正被越来越多地引入企业环境中处理新不同数据类型。机器生成的数据、传感器数据、社交数据、网络日志等数据类型呈指数级增长，而且这些数据也常常(但不总是)是非结构化。正是由于这种类型的数据将人机对话从“数据分析”带到大数据分析：因为挖掘这些数据可...
复制链接

扫一扫

专栏目录