SAS如何和HADOOP交互、集成?

88 篇文章 1 订阅
78 篇文章 0 订阅

经常有人咨询,SAS如何和HADOOP交互、集成?下面我们大圣众包小编分享一篇来自CSDN的Anyjack文章。在回答这个问题前,主要看HADOOP在SAS系统中的定位,有下面定位考虑:

  1.把HADOOP作为传统数据源供SAS访问

  这是最简单的一种应用场景,就是把HADOOP当做类似于ORACLE/DB2等之类的数据库源来使用,SAS有能力直接在HADOOP上进行数据处理,在HADOOP上进行直接数据读写

  2.把HADOOP作为分析平台

  通过在HADOOP上嵌入SAS分析组件,SAS可以使你在数秒内交互式浏览或者分析上十亿行记录。

  配合SAS 的Event Stream Process(实时事件处理引擎),你可以实时的分析当前数据,快速洞悉变化。

  3..把HADOOP作为数据管理平台

  使用SAS Data Loader for haddop组件,企业用户能利用其对HADOOP上的数据进行简单、快速的数据清洗、转换、数据质量管理等操作

  换另外一种方法来说,SAS针对HADOOP提供有FROM /WITH/IN的能力

  FROM

  你的数据可以来自(FROM)你的HADOOP系统,你也可以写数据从(FROM)SAS到HADOOP

  通过利用SAS/ACCESS to haddop组件或者使用SAS SPDE FOR HADOOP技术,你能像操作常规数据那样操作HADOOP

  WITH

  “With”是利用HADOOP上各个节点的存储能力和计算能力并行进行数据访问和处理的能力。而不像是”FROM”抓取、写入能力,存在一个管道来集中接收来自HADOOP的数据或者从一个管道往HADOOP中写入数据。

  “WITH”可以充分利用HADOOP各个节点的存储能力和计算能力,使HADOOP节点和SAS节点间并行交互和计算,比如SAS产品 Visual Analytics, Visual Statistics, In-Memory Statistics for Hadoop, High Performance Analytic procedures .

  IN

  “In”就是SAS支持直接在HADOOP中进行计算,所有的操作都在HADOOP内部完成,SAS只是负责提交代码、转换SAS代码为HADOOP代码(M/R)、接收代码执行结果。

  典型的SAS组件有:SAS Code Accelerator for Hadoop, SAS Data Quality Accelerator for Hadoop

  希望上述讲解能回答HADOOP和SAS的关系,让大家对SAS在HADOOP上的应用有个比较简单的理解。


  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值