[B类URI组合+性能预测]Web Application Resource Requirements Estimation based on the Workload Latent Features

最新推荐文章于 2024-10-01 14:28:06 发布

千灵域

最新推荐文章于 2024-10-01 14:28:06 发布

阅读量160

点赞数

分类专栏：计算机论文文章标签：性能预测云计算神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012837895/article/details/108816938

版权

计算机论文专栏收录该内容

12 篇文章 1 订阅

订阅专栏

Web Application Resource Requirements Estimation based on the Workload Latent Features

IEEE transactions on services computing, 2019 ,CCF B类

我个人是觉得这篇文章是非常重要的。

本文提出过去的预测式调度方法通常都只基于流量的输入值，而在相同流量输入值的情况下，CPU、内存占用、响应时间和网络带宽的值都可能是不一样的。因此本文更多关注于流量的隐特征，在本文中，流量的隐特征指的是请求的概率分布。

3 Proposed System methodology

在本阶段完成的是URI空间的映射。本文在前面分析了输入流量不同对于资源的压力是不一样的（见原文Fig1）。

3.1 URI-Space Partitioning

进行URI空间切分的目的是为了将需求相似资源的URI放在一类。本文将service time和document size作为聚类的重要指标，最终会分为k类（指定k）。分类时假定需要的资源在每一类中都呈正态分布（Assuming that the required resources, including CPU, memory, network and I/O are sampled randomly from a normal distribution for every URI in the subspace）

本文用来一个代价函数，聚类的目的是最小化这个代价函数，其实本质上还是一个k-means的过程。k从2逐渐往上增加，直到代价函数（描述error rate）变得最小。

这个函数太复杂了，我就不记录了，原文式(1)

3.2 Workload Latent Features Identification

上面一节将URI空间划分为K个子空间，下面会将读取历史上的日志，并将一个时间间隔内的所有日志进行聚合，将其到K个子空间的概率计算出来，所得到的概率即为隐特征（看原文Fig2会更清楚一点）

4 Resource Demand estimation

对比算法列了很多，Kriging Model(我有点没看明白，这不是个插值算法吗)、Ridge Regression、LASSO Regression

本文主打的算法是MLP，结构见Fig3。其实是很基本的想法，和我与师兄做的那个类似。每个ANN为两个隐层，首先各用一个ANN来预测CPU、内存和带宽，然后用三个+隐向量来预测响应时间。作者认为这样的好处就是训练的比较彻底，实际上应该差不多，因为ANN的梯度消失还是比较明显的，如果不这样做的话需要的数据量会大很多。

（但是我们之前实践的时候ANN是很不准确的，我们还是只用了单个URI做测试，最后是用强化学习强行把误差也考虑了进去，效果最后倒是还不错）

5 Experiment setup and design

测试用了两个benchmark：RUBIS和Acme Air（这两个都挺常用的……后面那个我见过微服务版本的，不知道前面的有没有）

实验中除了用隐特征向量之外，还使用了单纯的请求到达率作为baseline（这个就有点欺负人了）

从结果上来看，隐特征向量对于几乎所有的方法提升都很明显，并且在大部分情况下MLP效果都不错。

虽然图看着挺好的，但是实际指标上预测误差，特别是响应时间的预测误差还是很大的。而且对比指标中用的是MSE，而不是NRMSE这种比例性质的指标，因此不同数值之间也是有影响的，我觉得不够直观。

总结

总体而言是很不错的一篇文章，这个隐特征向量真的是有点东西。但是基于文档大小和响应时间来进行聚类有些不妥当，原因讲得不够让我信服。尽管效果很好，但我比较怀疑这种聚类方式的泛用性。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

千灵域 CSDN认证博客专家 CSDN认证企业博客

码龄11年

121: 原创

5万+: 周排名

13万+: 总排名

18万+: 访问

: 等级

2926: 积分

59: 粉丝

123: 获赞

24: 评论

559: 收藏

私信

关注

热门文章

分类专栏

最新评论

MIPS汇编快速入门
xht20041: $v0等于6的时候，应该会把输入数据赋值给$f0吧
C++实现代码雨
m0_63078743: #include <windows.h> #define ID_TIMER 1 #define STRMAXLEN 25 //一个显示列的最大长度 #define STRMINLEN 8 //一个显示列的最小长度 LRESULT CALLBACK WndProc (HWND, UINT, WPARAM, LPARAM) ; // // typedef struct tagCharChain //整个当作屏幕的一个显示列,这是个双向列表 { struct tagCharChain *prev; //链表的前个元素 TCHAR ch; //一个显示列中的一个字符 struct tagCharChain *next; //链表的后个元素 }CharChain, *pCharChain; typedef struct tagCharColumn { CharChain *head, *current, *point; int x, y, iStrLen; //显示列的开始显示的x,y坐标,iStrLen是这个列的长度 int iStopTimes, iMustStopTimes; //已经停滞的次数和必须停滞的次数,必须停滞的次数是随机的 }CharColumn, *pCharColumn; int main(HINSTANCE hInstance, HINSTANCE hPrevInstance, PSTR szCmdLine, int iCmdShow) { static TCHAR szAppName[] = TEXT ("matrix") ; HWND hwnd ; MSG msg ; WNDCLASS wndclass ; wndclass.style
C++实现代码雨
w770220: 我也是这句
beego的orm模型定义学习与实际测试
StefanLu: 想问一下，对于 Updated time.Time `orm:"auto_now;type(datetime)"` 。为什么我每次只是查询一条数据，并没有进行修改，但是对应数据的updateTime 的时间也是随动的
A container scheduling strategy based on machine learning in microservice architecture
请务必优秀: bookinfo 。。。没有注册中心怎么伸缩呀天

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。