博客专栏  >  互联网   >  Alluxio技术与实践

Alluxio技术与实践

本专栏用于分享介绍开源大数据存储系统Alluxio相关的技术与应用实践。

关注
1 已关注
8篇博文
  • 基于Alluxio,Mesos和Minio构建可扩展基因组数据处理流水线

    Guardant Health在综合液体活检方面处于世界领先水平。肿瘤学家收集整理我们的血液测试结果来帮助确定他们的晚期癌症患者是否适合使用某些药物,这些药物只对特定的肿瘤DNA基因变异有效。每个测试...

    4天前 17:21
    245
  • Alluxio 1.5.0开源发布版的技术亮点

    开源Alluxio 1.5.0已经发布了大量的新功能和改进。

    2017-08-16 16:42
    382
  • Arimo利用Alluxio的内存能力提升深度学习模型的结果效率(Time-to-Result)

    深度学习算法通常被一些具体应用所采用,其中比较显著的应用领域包括计算机视觉、机器翻译、文本挖掘、欺诈检测等。深度学习的方法在大模型加大数据的场景下效果显著。

    2017-06-12 13:49
    511
  • Alluxio 1.4版本的重要新特性介绍

    Alluxio 1.4.0已经发布了大量的新功能和改进。本篇博客介绍Alluxio 1.4.0开源版本的一些重要特性。

    2017-04-24 15:21
    1710
  • 使用Alluxio提升HDFS集群的性能和SLA稳定性

    我们使用Spark2.0来完成计算作业,并对比2种软件栈下作业的执行性能。第一种软件栈是将Spark作业直接运行在HDFS的数据上,另一种是将Spark作业运行在使用HDFS作为底层存储系统的Allu...

    2017-04-01 10:13
    1765
  • 使用Alluxio高效存储Spark RDD

    越来越多的公司和组织(例如百度和伯克利)开始将Alluxio和Spark一起部署从而简化数据管理,提升数据访问性能。

    2017-03-02 16:03
    1837
  • 利用Alluxio系统提升按需数据分析服务的性能

    在很多大数据应用场景中,某些具体的处理问题通常只涉及到整体数据集的一个子集或部分数据。这导致长时间占用大规模集群的整体数据分析方式的资源有效利用率较低,并且总体代价较高,尤其在系统采用计算和存储并置(...

    2017-02-22 13:32
    3618
  • 基于Alluxio系统的Spark DataFrame高效存储管理技术

    越来越多的公司和组织开始将Alluxio和Spark一起部署从而简化数据管理,提升数据访问性能。在这篇文章中,我们将介绍如何使用Alluxio帮助Spark变得更高效,具体地,我们将展示如何使用All...

    2017-01-23 15:18
    3079

img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部