spark：spark1.4.0+Tachyon--48

最新推荐文章于 2019-03-16 20:00:22 发布

一流小风一

最新推荐文章于 2019-03-16 20:00:22 发布

阅读量474

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fenger1943/article/details/46509861

版权

spark 专栏收录该内容

60 篇文章 0 订阅

订阅专栏

感觉好久没更新博客了···spark1.4.0版本已经出来了···其中sparkR终于出来、spark为应用提供了REST API来获取各种信息（jobs、stages、tasks、storage info），使用这个REST搭建监控可以很容易了解DAGScheduler的运行细节。···在新版本中shuffle的map阶段输出会被序列化（spill发送到磁盘上的文件小了、GC效率提高了）···Project Tungsten（传说中会在1.4版本以后继续修改内核，为了使硬件配置发挥到极致），引入UnsafeShuffleManager提供缓存排序算法，为了降低shuffle过程中的内存使用量。···sparkstreaming添加了新的UI。···sparkSQL支持更多的数据库。···

Tachyon文件系统

是一个分布式内存文件系统，可以在集群里以访问内存的速度来访问存在于Tachyon里的文件。

Tachyon是一个架构在最底层的分布式文件存储和上层的各种计算框架之间的一种中间键，用于将没有在DFS里的文件共享内存、提高效率。

HDFS和Tachyon的区别：

HDFS：设计用来存储海量文件的分布式系统；

Tachyon：设计用来缓存常用数据的分布式内存文件系统；

Tachyon采用Master/Slave架构、模式：单机、集群、高可用集群

Tachyon API： TachyonFs

/

scala:面向表达式语言（在代码中更多使用表达式而不用语句）

语句是可以执行的东西，表达式是可以求值的东西，语句执行代码不返回值，表达式返回值

scala绝大部分语句都返回其最后一个表达式的值

一流小风一

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark：spark1.4.0+Tachyon--48

感觉好久没更新博客了···spark1.4.0版本已经出来了···其中sparkR终于出来、spark为应用提供了REST API来获取各种信息（jobs、stages、tasks、storage info），使用这个REST搭建监控可以很容易了解DAGScheduler的运行细节。···在新版本中shuffle的map阶段输出会被序列化（spill发送到磁盘上的文件小了、GC效率提高了）···P
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。