云计算核心论文

Google
1. nosqldbs-NOSQL Introduction and Overview
2. system and method for data distribution(2009)
3. System and method for large-scale data processing using an application-independent framework(2010)
4. MapReduce: Simplified Data Processing on Large Clusters;
5. MapReduce-- a flexible data processing tool(2010)
6. Map-Reduce-Merge: Simplified Relational Data Processing on Large Clusters
7. MapReduce and Parallel DBMSs--Friends or Foes(2010)
8. Presentation:MapReduce and Parallel DBMSs:Together at Last (2010)
9. Twister: A Runtime for Iterative MapReduce(2010)
10. MapReduce Online(2009)
11. Megastore: Providing Scalable, Highly Available Storage for Interactive Services (2011,CIDR)
12. Interpreting the Data:Parallel Analysis with Sawzall
13. Dapper, a Large-Scale Distributed Systems Tracing Infrastructure (technical report 2010)
14. Large-scale Incremental Processing Using Distributed Transactions and Notifications(2010)
15. Improving MapReduce Performance in Heterogeneous Environments
16. Dremel: Interactive Analysis of WebScale Datasets(2011)
17. Large-scale Incremental Processing Using Distributed Transactions and Notifications
18. Chukwa: a scalable cloud monitoring System (presentation)
19. The Chubby lock service for loosely-coupled distributed systems
20. Paxos Made Simple(2001,Lamport)
21. Fast Paxos(2006)
22. Paxos Made Live - An Engineering Perspective(2007)
23. Classic Paxos vs. Fast Paxos: Caveat Emptor
24. On the Coordinator’s Rule for Fast Paxos(2005)
25. Paxos made code:Implementing a high throughput Atomic Broadcast (2009)
26. Bigtable: A Distributed Storage System for Structured Data(2006)
27. The Google File System

Google patent papers
1. Data processing system and method for financial debt instruments(1999)
2. Data processing system and method to enforce payment of royalties when copying softcopy books(1996)
3. Data processing systems and methods(2005)
4. Large-scale data processing in a distributed and parallel processing environment(2010)
5. METHODS AND SYSTEMS FOR MANAGEMENT OF DATA()
6. SEARCH OVER STRUCTURED DATA(2011)
7. System and method for maintaining replicated data coherency in a data processing system(1995)
8. System and method of using data mining prediction methodology(2006)
9. System and Methodology for Data Processing Combining Stream Processing and spreadsheet computation(2011)
10. Patent Factor index report of system and method of using data mining prediction methodology
11. Pregel: A System for Large-Scale Graph Processing(2010)

Hadoop
1. A simple totally ordered broadcast protocol
2. ZooKeeper: Wait-free coordination for Internet-scale systems
3. Zab: High-performance broadcast for primary-backup systems(2011)
4. wait-free syschronization(1991)
5. ON SELF-STABILIZING WAIT-FREE CLOCK SYNCHRONIZATION(1997)
6. Wait-free clock synchronization(ps format)
7. Programming with ZooKeeper - A basic tutorial
8. Hive – A Petabyte Scale Data Warehouse Using Hadoop
9. Thrift: Scalable Cross-Language Services Implementation(Facebook)
10. Hive other files: HiveMetaStore class picture, Chinese docs
11. Scaling out data preprocessing with Hive (2011)
12. HBase The Definitive Guide - 2011
13. Nova: Continuous Pig/Hadoop Workflows(yahoo,2011)
14. Pig Latin: A Not-So-Foreign Language for Data Processing(2008)
15. Analyzing Massive Astrophysical Datasets: Can Pig/Hadoop or a Relational DBMS Help?(2009)
a. Some docs about HStreaming,Zebra
16. HIPI: A Hadoop Image Processing Interface for Image-based MapReduce Tasks
17. System Anomaly Detection in Distributed Systems through MapReduce-Based Log Analysis(2010)
18. Benchmarking Cloud Serving Systems with YCSB(2010)
19. Low-Latency, High-Throughput Access to Static Global Resources within the Hadoop Framework (2009)

SmallFile Combine in hadoop world
1. TidyFS: A Simple and Small Distributed File System(Microsoft)
2. Improving the storage efficiency of small files in cloud storage(chinese,2011)
3. Comparing Hadoop and Fat-Btree Based Access Method for Small File I/O Applications(2010)
4. RCFile: A Fast and Space-efficient Data Placement Structure in MapReduce-based Warehouse Systems(Facebook)
5. A Novel Approach to Improving the Efficiency of Storing and Accessing Small Files on Hadoop: a Case Study by PowerPoint Files(IBM,2010)

Job schedule
1. Job Scheduling for Multi-User MapReduce Clusters(Facebook)
2. MapReduce Scheduler Using Classifiers for Heterogeneous Workloads(2011)
3. Performance-Driven Task Co-Scheduling for MapReduce Environments
4. Towards a Resource Aware Scheduler in Hadoop(2009)
5. Delay Scheduling: A Simple Technique for Achieving
6. Locality and Fairness in Cluster Scheduling(yahoo,2010)
7. Dynamic Proportional Share Scheduling in Hadoop(HP)
8. Adaptive Task Scheduling for MultiJob MapReduce Environments(2010)
9. A Dynamic MapReduce Scheduler for Heterogeneous Workloads(2009)

HStreaming
1. HStreaming Cloud Documentation
2. S4: Distributed Stream Computing Platform(yahoo,2010)
3. Complex Event Processing(2009)
4. Hstreaming : http://www.hstreaming.com/resources/manuals/
5. StreamBase: http://streambase.com/developers-docs-pdfindex.htm
6. Twitter storm: http://www.infoq.com/cn/news/2011/09/twitter-storm-real-time-hadoop
7. Bulk Synchronous Parallel(BSP) computing
8. MPI

SQL/Mapreduce
1. Aster Data whilepaper:Deriving Deep Insights from Large Datasets with SQL-MapReduce (2004)
2. SQL/MapReduce: A practical approach to self-describing,polymorphic, and parallelizable user-defined functions(2009,aster)
3. HadoopDB: An Architectural Hybrid of MapReduce and DBMS Technologies for Analytical Workloads(2009)
4. HadoopDB in Action: Building Real World Applications(2010)
5. Aster Data presentation: Making Advanced Analytics on Big Data Fast and Easy(2010)
6. A Scalable, Predictable Join Operator for
7. Highly Concurrent Data Warehouses(2009)
8. Cheetah: A High Performance, Custom Data Warehouse on Top of MapReduce(2010)
9. Greenplum whilepaper:A Unified Engine for RDBMS and MapReduce(2004)
10. A Comparison of Approaches to Large-Scale Data Analysis(2009)
11. MAD Skills: New Analysis Practices for Big Data (2009)
12. C Store A Column oriented DBMS(2005)
13. Distributed Aggregation for Data-Parallel Computing: Interfaces and Implementations(Microsoft)

Microsoft
1. Dryad: Distributed Data-Parallel Programs from Sequential Building Blocks (2007)

Amazon
1. Dynamo: Amazon’s Highly Available Key-value Store(2007)
2. Efficient Reconciliation and Flow Control for Anti-Entropy Protocols
3. The Eucalyptus Open-source Cloud-computing System
4. Eucalyptus: An Open-source Infrastructure for Cloud Computing(presentation)
5. Eucalyptus : A Technical Report on an Elastic Utility Computing Archietcture Linking Your Programs to Useful Systems (2008)
6. Zephyr: Live Migration in Shared Nothing Databases for Elastic Cloud Platforms(2011)
7. Database-Agnostic Transaction Support for Cloud Infrastructures
8. CloudScale: Elastic Resource Scaling for Multi-Tenant Cloud Systems(2011)
9. ELT: Efficient Log-based Troubleshooting System for Cloud Computing Infrastructures

Books
1. Distributed Systems Concepts and Design (5th Edition)
2. Principles of Computer Systems (7-11)
3. Distributed system(chapter)
4. Data-Intensive Text Processing with MapReduce (2010)
5. Hadoop in Action
6. 21 Recipes for Mining Twitter
7. Hadoop.The.Definitive.Guide.2nd.Edition
8. Pro hadoop

Other papers about Distributed system
1. Flexible Update Propagation for Weakly Consistent Replication(1997)
2. Providing High Availability Using Lazy Replication(1992)
3. Managing Update Conflicts in Bayou,a Weakly Connected Replicated Storage System(1995)
4. XMIDDLE: A Data-Sharing Middleware for Mobile Computing(2002)
5. design and implementation of sun network filesystem
6. Chord: A Scalable Peertopeer Lookup Service for Internet Applications(2001)
7. A Survey and Comparison of Peer-to-Peer Overlay Network Schemes(2004)
8. Tapestry: An Infrastructure for Fault-tolerant Wide-area Location and Routing(2001)

BI
1. 21 Recipes for Mining Twitter(Book)
2. Web Data Mining(Book)
3. Web Mining and Social Networking(Book)
4. mining the social web(book)
5. TEXTUAL BUSINESS INTELLIGENCE (Inmon)
6. Social Network Analysis and Mining for Business Applications(yahoo,2011)
7. Data Mining in Social Networks(2002)
8. Natural Language Processing with Python(book)
9. data_mining-10_methods(Chinese editation)
10. Mahout in Action(Book)
11. Text Mining Infrastructure in R(2008)
12. Text Mining Handbook(2010)

Web search engine
1. Building Efficient Multi-Threaded Search Nodes(Yahoo,2010)
2. The Anatomy of a Large-Scale Hypertextual Web Search Engine(google)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
37篇经过消化的云计算论文 下列论文归类: 1、云计算设施管理 监测 2,34 负载均衡 33,35 数据管理 32 能耗管理 29 安全管理 25 2、云计算平台实例 虚拟机 27,31 存储平台 5,6,12,13,14,19,22,26 计算平台 平台测评 1 云平台集成 10 3、云计算理论模型 描述模型 4 选择模型 20 编程模型 7,9,18,24,36 4、云计算应用研究 商业应用 科学应用 11,15,17,23 云安全 21,30 1、 Atmosphere-Ocean Climate (性能测试) 这篇文章讨论了高性能标准测试应用程序在亚马逊EC2云计算系统中的性能。经过测试发现EC2云计算系统是一个可靠的解决方案,支持按需响应,小规模,高性能计算应用程序。 2、 Chukwa: A large-scale monitoring system Chukwa是建立在Hadoop上的数据收集系统,用以监控和分析大规模的分布式系统。本文介绍了他的设计和初步实施。 3、 Cloud Computing and Grid Computing 360-Degree Compared Ian Foster比较对比了云计算和网格计算的各方面,并给出了两者的本质特征。 4、 Toward a Unified Ontology of Cloud Computing 这篇文章把云模型分为5层,解释了他们的内在关系,本文的贡献是第一个对云模型建立本体。 5、 The Cumulus Project: Build a Scientific Cloud for a Data Center 介绍了Cumulus工程的各个方面,如实验床,基础设施,中间件和应用程序模型。 6、 The Eucalyptus Open-source Cloud-computing System Eucalyptus作为云计算开源的软件框架,概述了他设计的基本原则,简单易于使用而且能模块化。 7、 GridBatch: Cloud Computing for Large-Scale Data-Intensive Batch Applications GridBatch系统为解决在云计算下的大规模精密数据批处理问题,GridBatch是一个编程模型,用户能控制数据的分割,控制计算怎么被分布的,最后给出一个例子,展示了他在EC2下的高性能。 8、 Cost-Benefit Analysis of Cloud Computing versus Desktop Grids 分析对比了采用云计算模型和桌面电脑组成的网格模型在性能和成本收益方面的优劣。 9、 Programming Abstractions for Clouds 本文讨论了云应用程序编程面临的挑战与发展,通过几个应用程序的讨论,演示了可能的解决方案。同时讨论了怎样正确使用抽象的编程接口,框架使其更有效,可扩展,最重要的独立于系统,这些接口框架支持普通的编程执行模式。 10、 The RESERVOIR Model and Architecture for Open Federated Cloud Computing 本文提出了RESERVOIR工程,他是一个体系结构,他允许云基础设施的提供者动态的和其他云设施成为伙伴,从而构成一个无限的信息资源池,同时不同的云设施保证他自己技术和商业管理决定高度自治。 11、 Science Clouds: Early Experiences in Cloud Computing for Scientific Applications 这篇文档包含科学项目采用科学云技术的描述,还有他经验的早期总结。 12、 Sector and Sphere: The Design and Implementation of a High Performance Data Cloud 在这篇论文中,我们介绍了一个新的云计算软件,他包括Sector存储云和Sphere计算云。对比现有的数据云,Sector不但支持作为数据中心的数据存储,而且可以在广域网上进行数据分发。Sphere执行流处理示例,从而支持数据密集型的应用。Sphere支持所有能用MapReduce完成的应用,Sphere更简单更容易使用。根据我们的实验研究他的速度是Hadoop的两倍。 13、 Phoenix Cloud: Consolidating Different Computing Loads on Shared Cluster System for Large Organization 在论文中,我们设计运行了software-phoenix云管理系统,在共享的集群系统中整合异构的计算负载。进一步,我们还提出了供大组织和他附属部门共享集群系统的合作资源提供和管理策略。Phoenix Cloud减少了系统的规模。 14、 Adapting MapReduce for Dynamic Environments Using a Peer-to-Peer Model 本文作者描述基于P2P的MapReduce的体系结构,概述了在JXTA框架下的运行情况。 15、 Parallelizing bioinformatics applications with MapReduce 本文讲了采用mapreduce技术来完成并行的生物分析的一个应用。本文的这个应用是在Hadoop下完成的,讲了两个算法,一个用于支持大规模数据集的流计算,一个用于计算小数据集的策略。 16、 Do Clouds Compute? A Framework for Estimating the Value of Cloud Computing 在这篇论文中,我们讨论了云计算中的核心组件,以及在框架中构建组件,这个框架能帮助决策者评估云计算的成本,对比传统解决方案和云计算方案在成本上的差异。 17、 Using Transaction Based Parallel Computing to Solve Image Processing and Computational Physics Problems 本文讲了在Hadoop下用并行计算来解决图像处理和计算物理学的问题。 18、 All-Pairs: An Abstraction for Data-Intensive Cloud Computing 本文提出形成产品的系统应该为终端用户提供高度抽象的使用方法,以便容易表达,对于精密数据的工作量能高效的执行。文中提出了一个抽象的例子,all-pairs,他满足精密数据科学应用的需要。 19、 Seattle: A Platform for Educational Cloud Computing 本文介绍了用于教育界的云计算平台。讲了他的体系,部署,对于学生和教师的使用概况。 20、 Cloud Cube Model: Selecting Cloud Formations for Secure Collaboration 本文解释了不同云的构成,详述了每种云构成的特征,优势和风险。 21、 CloudAV: N-Version Antivirus in the Network Cloud 本文提出了一种在终端主机上检测恶意病毒的新模型。这种检测是基于提供防病毒软件作为一个云网络服务。我们构建配置了云防病毒系统,CloudAV,他包括轻量级跨平台的主机代理,一个由十个防病毒软件引擎构成的网络服务,和两个检测引擎。经过测试有很好的性能。 22、 Implementation Issues of A Cloud Computing Platform 本文在对GFS研究的基础上,设计出可变块大小的兼容文件系统,以便大数据的处理。同时介绍了对MapReduce的改进以增加系统的吞吐量。 23、 Scalable Semantics – the Silver Lining of Cloud Computing 本文提出在云计算模型下快速的进行分布式RDF的查询和推理。 24、 On the Use of Cloud Computing for Scientific Workflows 本文提出在科学工作流中使用云计算,经过测试比较,对于作业运行时间短的工作流,虚拟的环境能有好的计算时间性能,但同时也有资源调度延迟的缺点。 25、 Taking Account of Privacy when Designing Cloud Computing Services 本文讨论了云计算中面临的机密性的问题,提出了解决机密性问题的关键设计原则。 26、 Cloud Computing for e-Science with CARMEN CARMEN供神经学家共享,整合,分析数据的一个系统,本文概述了这个系统。该系统在云计算这个模型下。 27、 An Evaluation of KVM for Use in Cloud Computing 本文描述了一个基于内核虚拟机的虚拟集群,以取代VMware和Xen。本文提出了虚拟组织集群模型技术,他显示了云计算强大的潜能。 28、 A Tale of Clouds: Paradigm Comparisons and Some Thoughts on Research Issues 本文定性的比较了云计算,服务计算,普适计算各方面的特点。 29、 Energy Aware Consolidation for Cloud Computing 本文讨论了云计算中的能量问题,为了使能量有效的整合,我们要研究能量消耗,资源利用,整合后的工作量的性能之间的内在关系,研究揭露了能量性能的权衡与整合,证明存在最佳的工作点,我们模拟了整合的问题,并用一个例子进行了解释。 30、 Toward Automatic Discovery of Malware Signature for Anti-virus Cloud Computing 防病毒安全产品由于他们有大量签名的文件,消耗了大量PC内存和资源,防病毒云计算模型变成流行的解决方案。本文提出了AMSDS在防病毒云下的自动恶意病毒签名发现系统,经测试有很好的性能。 31、 SnowFlock: Rapid Virtual Machine Cloning for Cloud Computing 克隆虚拟机 虚拟机fork是一个新的云计算抽象,他能快速的克隆虚拟机成很多副本运行在不同的主机上。本文提出了SnowFlock项目,他是虚拟机fork的一个实现。文中讲了他的设计原理和实现机制,并对性能进行了测试分析。 32、 Data Management in the Cloud: Limitations and Opportunities 本文讨论了在云计算平台下数据管理的限制与优势。列出了在亚马逊平台下为大型数据分析而设计的DBMS应包含的一些特征。本文还表达了在云计算环境下对新的DBMS的需要。 33、 Cloud Control with Distributed Rate Limiting 这篇文章提出了分布式等级限制器的设计与实现,他能够调整基于云服务的网络通信的策略。这种抽象与设计不但执行全局的限制,同时他确保传输层的响应拥塞流表现得像被单一共享的限制器所控制。这种设计能允许服务的执行者明确的在通信代价和系统效率可靠性之间做出权衡。同时他们证明他们基于中心TCP的设计可在许多节点进行升级,减少系统的通信延迟和损耗。 34、 Computer Meteorology: Monitoring Compute Clouds 云计算环境允许用户在云供应商的硬件上执行任意的代码,云用户面临很多安全的挑战,恶意用户可以利用供应商的硬件发动攻击,这种攻击能破坏供应商的信誉,同时影响他服务于其他客户的能力。我们表明,尽管云供应商可以利用内部机制,检测用户虚拟机恶意行为,必须小心使用,因为现有的内部技术是基于假设并不拥有在云环境中。 35、 Optimizing Utility in Cloud Computing through Autonomic Workload Execution 36、 LINQ-to-DataCenter 37、 Cloud Computing & Databases How databases can meet the demands of cloud computing

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值