clusterdata-2011-2 谷歌集群数据分析(一)

本文介绍了谷歌集群数据的六个主要文件,包括机器事件、机器属性、作业事件表、任务事件表、任务约束和任务资源使用情况。详细解析了各表格的字段,如时间戳、事件类型、优先级、资源请求等,并探讨了任务优先级的五个类别及其意义。数据集可用于深入理解谷歌集群的工作机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据获取地址:

链接:https://pan.baidu.com/s/1r0AOSstlLV1YSetwbdwJcg 
提取码:0ob8 

说明文档获取地址:

链接:https://pan.baidu.com/s/1h10kaiS89sfsPSjfcB7G6g 
提取码:rd3p

谷歌集群数据主要包括六个文件,总大小为41个G,先就每种表的属性名称及含义做一个统计。

Machine events:

        1. timestamp  2. machine ID  3. event type  4. platform ID  5. capacity: CPU  6. capacity: memory

        其中时间戳的单位是微秒,事件类型属性值为0(ADD)、1(Remove)、2(Update),平台ID为不透明字符串。

Machine attributes:

        1. timestamp  2. machine ID  3. attribute name  4. attribute value  5. attribute deleted

        属性名称为不透明字符串,属性值是一个数字或者字符串,属性删除是一个布尔值,指示属性是否被删除

Job events t

评论 48
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值