- 博客(4)
- 资源 (1)
- 收藏
- 关注
转载 MTBF MTTR MTTF
1. MTBF——全稱是Mean Time Between Failure,即平均失效間隔。就是從新的產品在規定的工作環境條件下開始工作到出現第一個故障的時間的平均值。MTBF越長表示可靠性越高正確工作能力越強 。 2. MTTR——全稱是Mean Time To Repair,即平均修複時間。就是從出現故障到恢復中間的這段時間。MTTR越短表示易恢復性越好。 3. MTTF
2012-06-29 17:39:26 1538
转载 Nodes, Sockets, Cores and FLOPS
Recently, a fellow blogger here at HPCatDell, Dr. Jeff Layton, has been running a series onPetaFLOPS for the Common Man. In that series, he writes that in the November 2009 Top500 list there are a
2012-06-04 15:38:22 633
原创 在Condor中执行Checkpoint
Condor运行有多种模式,不同的模式有各自不同的功能。在standard模式下,Condor提供检查点和远程系统调用。这些特性使得任务的运行更加可靠并且允许任务从机群中的任何地点以相同方式访问资源。要把一个程序配置成标准模式任务,就必须使用condor_compile进行重连接。大多数程序都能配置成标准模式任务。一个检查点映像本质上就是任务当前运行状态的一幅快照。如果某件任务必须从一台机
2012-06-02 12:46:15 1192
原创 初步安装Condor
1. 准备 [root@node1 /]# cat /etc/hosts# Do not remove the following line, or various programs# that require network functionality will fail.127.0.0.1 localhost.localdomain localhos
2012-06-02 12:41:35 3376 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人