论文笔记
文章平均质量分 88
记录每一篇精读的论文,不要让时间成为遗忘的理由
MusicLEEE
喜欢做游戏
展开
-
[论文笔记]流式图分区方法的实验研究
Streaming Graph Partitioning: An Experimental Study本文介绍了主流的几种流式图分区方法,并设置实验比较了它们的性能。研究背景在分布式计算流行的当下,图分区是一项非常基础且重要的技术。对大多数图算法而言,如果想要将之置于分布式环境下并行执行,必须对输入的图结构进行分区处理。典型的图算法有SSSF,PageRank,Connected Component,Label Propagation等。图分区不是一项简单的工作,一个理想的图分区方式应该达到两个目标原创 2021-06-21 11:40:51 · 2329 阅读 · 0 评论 -
[论文笔记]使用GPU处理数据仓库查询之“阴”和“阳”
The Yin and Yang of Processing Data Warehousing Queries on GPU Devices研究背景在数据库领域,使用GPU进行查询加速已经被人们研究了好几年。但是在数据仓库领域,我们却很少发现有人研究GPU对数据仓库查询进行加速的课题。对数据仓库的查询往往伴随着巨大的计算开销,而GPU拥有强大的并行计算能力。如果能将使用GPU进行加速,会大大提升数据仓库的OLAP速度,加快数据仓库OLAP技术的发展。主要工作作者从三个维度对“数据仓库+GPU”这个原创 2021-03-21 11:46:35 · 481 阅读 · 1 评论 -
[论文笔记]Graph OLAP: 面向图的联机分析处理
Graph OLAP: Towards Online Analytical Processing on Graphs研究背景联机分析处理(OLAP)是数据分析的一种重要方式。传统的OLAP是对相互独立的数据进行处理,即不考虑数据元组之间的关系。比如超市顾客的购物信息,数据仓库保存的是每个顾客购物时购买的商品集合。使用OLAP可以分析商品之间的关系,挖掘出有用的信息供超市老板调整策略。传统的OLAP并不能很好的适用于图结构的分析,而对图进行信息挖掘的重要性越来越大。作者基于该现状,提出了基于图的联机分析原创 2021-03-13 12:15:27 · 467 阅读 · 0 评论 -
[论文笔记]Graph Cube: 基于数据仓库和OLAP多维网络
Graph Cube: On Warehousing and OLAP Multidimensional Networks研究背景数据仓库是一种为企业进行决策制定的工具。区别于数据库,数据仓库的主要功能并非保存数据,而是为数据分析师,战略制定者提供服务的。如上图所示,数据仓库的基本模型是数据立方体(Cube),数据立方体由多个方体(Cuboid)组成。每个方体可以表示为一张表,属性为方体的维度,表中的元组称为Cell。以往人们在使用数据仓库时,总是根据维度需求在数据立方体中计算出单个所需的方体,以原创 2021-03-05 12:20:58 · 587 阅读 · 1 评论 -
[论文笔记]Storm@Twitter
简介Storm是Twitter推出的一款实时的、容错的、分布式的计算系统,该系统目前广泛应用于Twitter的多项重要计算中。本篇文章简单地介绍了Storm的系统架构,描述了Storm是如何执行拓扑(topology)计算的。Storm的设计目标有以下几点:可扩展性(Scalable):系统可以简单地在Storm集群中添加或删除节点,同时不影响当前的系统工作;适应性(Resilient):系统拥有良好的容错能力,这是因为Storm通常部署在大规模的集群上,出现节点故障的概率较高;可延展性(Ext原创 2021-02-10 00:29:34 · 616 阅读 · 2 评论 -
[论文笔记]LegoOS:一种硬件资源分解的分布式操作系统
LegoOS: A Disseminated, Distributed OS for Hardware Resource Disaggregation 文章设计了一种新型的操作系统架构—splitkernel:将处理器、内存、外存在网络上分开,所有信息交互均通过网络的形式进行。这是一种新型分布式系统,这样做的好处有:避免了水桶效应,即由于部分硬件的性能限制,使其它硬件性能无法充分发挥。易于增加或减少硬件,即拥有较好的可扩展性。避免部分硬件故障导致整体不可用。解决异构硬件难以兼容问题。原创 2021-01-19 15:52:29 · 2302 阅读 · 3 评论 -
[论文笔记]Maiter:一种基于Delta的累积迭代计算的异步图处理框架
Maiter: An Asynchronous Graph Processing Framework for Delta-based Accumulative Iterative Computation背景: 传统的图处理框架一般为同步迭代的方式,也就是同一迭代内并行;不同迭代中串行。典型的同步图计算框架包括Pregel和MapReduce。同步迭代方式最大的局限在于水桶效应,执行速度最慢的线程会影响整个系统的执行效率,因为只有所有线程都完成了本轮迭代计算,系统才能进入下一轮迭代。 据此人原创 2021-01-22 18:03:43 · 646 阅读 · 0 评论