论文笔记
铁头乔
公众号:铁头乔
展开
-
Building the Enterprise Fabric for Big Data with Vertica and Spark Integration
通过大数据分析与Spark构建企业级大数据平台 主要工作:集成了HPE Vertica enterprise database和Spark开源大数据计算引擎 优势: 可以快速、可靠地在Vertica和Spark中传输数据,并将spark生成的机器学习库部署在Vertica,来分析Vertica中的数据。这种架构扩展了Vertica的丰富的SQL分析功能和Spark的机器学习库翻译 2017-01-03 13:45:33 · 1002 阅读 · 0 评论 -
Probabilistically Bounded Staleness for Practical Partial Quorums
概率有界过时的实际部分法定人数 部分、不严格的法定人副本中,读写副本集不要求相交,这样只能保证最终一致性,但是实际中却发现给定的延迟要求时部分法定人工作的很好。本文提出概率有界过时一致性。展示了为什么最终一致性系统能够在给定的延迟需求时经常返回一致的数据。 Quorum:R+W>N,强一致性 Partial quorums:R+W Dynamo是原创 2017-01-03 13:46:31 · 576 阅读 · 0 评论 -
Session Guarantees for Weakly Consistent Replicated Data
这篇论文介绍了四种会话一致性的定义以及实现方法。这里的会话不仅表示一次连接,而是广义的,比如一个客户,多次连接也算一个session。 四种一致性保证为: read your writes:读操作能反映之前的写 monotonic reads:成功的读反映非下降的写集合 writes follow reads:写 在 他们依赖的读 后 传播 monotonic writes:原创 2017-01-03 13:47:58 · 438 阅读 · 0 评论 -
TARDiS:A Branch-and-Merge Approach To Weak Consistency
事务异步复制的不同存储:弱一致性的分支与合并方法 摘要: 本文叙述了一个针对弱一致性系统设计的事务型键值对存储系统——TARDIS的设计、实现和评估。 TARDIS暴露出在弱一致性系统中出现的基础的抽象概念:冲突-》分支的集合。 提出了一种新的并发控制机制:冲突-》分支。 以此来保证从一个分支继承出的执行线程看到的存储是有序的,保证应用逻辑简单。还提供了应用随时按需自动合并分支。翻译 2017-01-03 13:53:57 · 575 阅读 · 0 评论 -
TPC-DI: The First Industry Benchmark forData Integration
TPC:事务处理性能委员会 小型的数据集成:一系列定制化的程序,数据库的存储过程实现。 中大型数据集成:使用通用的数据集成工具 两种load进程: historical load:load所有数据 incremental update:插入、更新、删除数据 源数据模型: CDC(change data capture),距上次修改过的数据,翻译 2017-01-03 13:54:25 · 637 阅读 · 0 评论