利用R语言实现spark大数据分析与可视化

最新推荐文章于 2024-07-16 14:49:18 发布

0x12A2A7F

最新推荐文章于 2024-07-16 14:49:18 发布

阅读量6.4k

点赞数 5

分类专栏： Big Data Data Analysis 文章标签： R 可视化

Big Data 同时被 2 个专栏收录

77 篇文章 1 订阅

订阅专栏

25 篇文章 0 订阅

订阅专栏

系统概述

在日常业务分析中， R是非常常用的分析工具，而当数据量较大时，用R语言需要需用更多的时间来完成训练模型，spark作为大规模数据计算框架，采用内存计算，可以短时间内完成大量的数据的处理及计算模型，但缺点是不能图形展示， R语言的sparkly则提供了R语言和Spark的接⼝，实现了在数据量大的情况下，应用Spark的快速数据分析和处理能力结合R语言的图形化展示功能，方便业务分析，模型训练，同时R语言还可以与Hadoop，HDFS，Hbase，redis，MongoDB等大数据平台数据实现交互，以及作业递交与分析，本文主要介绍平台的架构方法，以及各个组件基本使用方法。

系统构建与调试

基础环境介绍：
操作系统 RHEL 6.5 / CentoOS 6.5
已安装软件 Hadoop Hbase Hive Spark Redis MongoDB Mysql 等大数据应用软件

关注

5
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。