云计算论文读书笔记1

最新推荐文章于 2023-03-01 23:36:09 发布

ZETARUN

最新推荐文章于 2023-03-01 23:36:09 发布

阅读量1.8k

点赞数

分类专栏：云计算概论

本文链接：https://blog.csdn.net/ZETARUN/article/details/106146220

版权

本文提出了一种两阶段机器学习方法，用于预测云计算系统中不同输入数据的工作流任务执行时间。该方法依赖于反映运行时信息的参数，通过历史数据训练，对四个真实世界工作流应用程序的实验表明，该方法优于现有预测方法，最佳情况误差为1.6%，最坏情况误差为12.2%。此外，该方法的模型可移植到新云上，只需少量运行就能产生低误差。

摘要由CSDN通过智能技术生成

论文读书笔记

论文：
Predicting Workﬂow Task Execution Time in the Cloud Using A Two-Stage Machine Learning Approach

作者：
Thanh-Phuong Pham , Juan J. Durillo, and Thomas Fahringer , Member, IEEE

期刊：
IEEE TRANSACTIONS ON CLOUD COMPUTING, VOL. 8, NO. 1, JANUARY-MARCH 2020

摘要：
许多技术，例如调度和资源配置等，都依赖于对不同输入数据的工作流任务的性能预测。然而，这样的预测很难在云计算系统中生成。本文介绍了一种新的两阶段机器学习方法，用于预测云计算系统中不同输入数据的工作流任务执行时间。为了实现高精度的预测，我们的方法依赖于反映运行时信息的参数和两个预测阶段。对四个现实世界中的工作流应用程序和几个商业云提供商的实证结果表明，我们的方法优于现有的预测方法。在我们的实验中，我们的方法分别得到的最佳情况估计误差和最坏情况估计误差为1.6%和12.2%，而现有的方法在超过75%的评估工作流任务中得到了超过20%的误差(在某些情况下甚至超过50%)。此外，我们还展示了我们预测特定云的方法产生的模型可以很容易地移植到新云上，并且只需要少量的运行就可以产生低误差。

一. 研究背景
本文的研究背景主要有两个部分：
1，工程背景
云计算范式为科学应用提供了各种优势，包括资源的快速提供、按使用付费和资源的灵活弹性。现在，许多科学家也使用科学工作流来组合他们的应用程序，以便在云上运行。工作流应用程序[1]由大量组件组成，如遗留程序、数据分析或计算方法、复杂模拟或更小的子工作流。
科学工作流应用程序非常耗时，在云基础设施上运行它们的成本非常高。所以科学工作流应用程序的一个重点就是对它运行时间、资源使用和经济成本进行有效优化。优化可以由不同技术实现，重点是调度资源去每个执行工作流任务的地方，以及确定任务所需要资源的种类和数量[2]。这些调度和资源配置技术通常可以从工作流任务的运行时间信息中获益。然而，由于各种原因，任务运行时间并不容易在运行前得知。所以，作者需要一种方法来预测工作流任务的运行时间。

2，学术背景
对集群、网格或云的性能预测的研究已经活跃了几十年。传统的方法可以分为三类：1，分析建模；2，仿真模拟；3，经验评价。第一类，分析建模，包括基于应用程序和体系结构的高级抽象的方法，这些方法易于快速评估。第二类，仿真模拟，是基于模拟/仿真应用程序如何在给定的目标体系结构上运行的思想。模拟器/仿真器允许一个高精确度的硬件细节模型，但是生成的计算成本很高。典型的模拟器/仿真器需要应用程序的源代码和精确的硬件信息，根据这些信息计算机器指令的数量及其执行时间。第三类，经验评估，依赖于一个更快的硬件模型原型来评估和测量应用程序运行时。这类方法的适用性取决于此类硬件原型的可用性。对于云计算来说，很难确定任务运行的硬件，因此，第三类方法不适用于作者的情况。接下来，作者进一步分析属于前两类的一些相关工作。
一些预测方法基于一个回归函数，该函数从一组独立变量估计应用程序的运行时间。这种方法就属于分析建模的范畴。相关的论文有很多，不同之处在于确定回归函数的方式及其所依赖的变量。最流行的回归方法是机器学习，简化形式就是线性回归；还有其他回归方法，如最近邻，实例模型学习，回归树，或者是以上这些方法的组合。性能预测方法所依赖的自变量的典型例子是应用程序输入数据、内核数量和其他特定的硬件细节。例如，作业名、用户名和提交时间被用来预测集群[3]、[4]中的执行时间。其他工作需要系统性能属性(CPU微架构、大小、内存和存储速度)[5]。据[6]、[7]报告，CPU架构、内存和存储速度是提高预测应用程序执行时间准确性的重要属性。然而，