HTCondor 有用的资源

原创 2015年11月18日 06:00:49


Getting started: Creating a multiple node Condor pool

 

[1] HTCondor默认使用TCP向condor_collector服务器发送更新请求.  condor_collector 服务器 由 CONDOR_VIEW_HOST设定


UPDATE_COLLECTOR_WITH_TCP


    默认值为True. HTCondor 使用TCP更新 condor_collector.如设置为 False, the HTCondor daemons 将使用 UDP 来更新 condor_collector.


UPDATE_VIEW_COLLECTOR_WITH_TCP


     When set to True, the HTCondor collector will use TCP to forward updates to condor_collector daemons specified by CONDOR_VIEW_HOST, instead of the default UDP. Defaults to False.


TCP_UPDATE_COLLECTORS


当 UPDATE_COLLECTOR_WITH_TCP 或 UPDATE_VIEW_COLLECTOR_WITH_TCP 被设置为 False时,.使用 TCP 更新 一组 condor_collector 服务器



[2]  within the collector log of the form

DaemonCore: PERMISSION DENIED to host <xxx.xxx.xxx.xxx> for command 0 (UPDATE_STARTD_AD)
indicates a permissions problem. The condor_startd daemons do not have write permission to the condor_collector daemon. This could be because you used domain names in your HOSTALLOW_WRITE and/orHOSTDENY_WRITE configuration macros, but the domain name server (DNS) is not properly configured at your site. Without the proper configuration, HTCondor cannot resolve the IP addresses of your machines into fully-qualified domain names (an inverse look up). If this is the problem, then the solution takes one of two forms:
  1. Fix the DNS so that inverse look ups (trying to get the domain name from an IP address) works for your machines. You can either fix the DNS itself, or use the DEFAULT_DOMAIN_NAME setting in your HTCondor configuration file.
  2. Use numeric IP addresses in the HOSTALLOW_WRITE and/or HOSTDENY_WRITE configuration macros instead of domain names. As an example of this, assume your site has a machine such as foo.your.domain.com, and it has two subnets, with IP addresses 129.131.133.10, and 129.131.132.10. If the configuration macro is set as

     HOSTALLOW_WRITE = *.your.domain.com
    

    and this does not work, use

     HOSTALLOW_WRITE = 192.131.133.*, 192.131.132.*
    

Alternatively, this permissions problem may be caused by being too restrictive in the setting of your HOSTALLOW_WRITE and/or HOSTDENY_WRITE configuration macros. If it is, then the solution is to change the macros, for example from

 HOSTALLOW_WRITE = condor.your.domain.com
to
 HOSTALLOW_WRITE = *.your.domain.com
or possibly
 HOSTALLOW_WRITE = condor.your.domain.com, foo.your.domain.com, \
 bar.your.domain.com

Another likely error message within the collector log of the form

DaemonCore: PERMISSION DENIED to host <xxx.xxx.xxx.xxx> for command 5 (QUERY_STARTD_ADS)
indicates a similar problem as above, but read permission is the problem (as opposed to write permission). Use the solutions given above.


 只在安装了特定软件的计算节点上运行计算任务,应如何配置?


  具体方法[4]分两步:
   步骤1:
     在安装了特定软件的计算节点的配置文件添加 参数 
     HAS_MY_SOFTWARE = True
     然后 添加 
      STARTD_ATTRS = HAS_MY_SOFTWARE, $(STARTD_ATTRS) 


   步骤2:
     在计算任务submit文件中添加
      Requirements = (HAS_MY_SOFTWARE =?= True)


参考文献

[1] Using TCP to Send Updates to the condor_collector

[2 ]collector permission problem

[3] https://github.com/htcondor/htcondor

[4 http://research.cs.wisc.edu/htcondor/manual/v7.8/7_2Setting_up.html  


版权声明:版权声明:本人拥有该Blog内全部原创文章的所有权利。欢迎转载,但务必注明原文链接。任何个人、组织、网站、出版社不得在未经本人许可的情况下用于商业目的。

HTCondor 相关资料及提交任务示例

HTCondor 资料High Throughput Computing (HTC) 官网:HTCondor 官网quickstart: quickstart 官网tutorial: tutorial...

condor 使用详解

首先,submit一个job需要先创建一个执行程序和描述文件。 在ubuntu里,可以在自己的home文件夹下创建一个examples文件夹存放测试程序,然后sudo chmod -r 777 文件夹...

在Windows中安装 HTCondor

创建新 HTCondor-8.5.0 pool 步骤 master节点的co...

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

# Ubuntu 下HTCondor 8.2.8安装

Ubuntu 下HTCondor 8.2.8安装 声明:安装部分参考[酌希的专栏] http://blog.csdn.net/yuan13091324/article/details/430...

数据结构题库,很有用的资源。

  • 2011年04月22日 15:10
  • 196KB
  • 下载

精通正则表达式的 12 个有用资源[转载]

出处: 精通正则表达式的 12 个有用资源 任何开发项目,不管使用的何种编程语言,经常都需要从给定的数据中提取一些值然后进行验证。例如输入的校验、过滤 URL 变量之类。而正则表达式用来处理...

7个很有用的HTML5学习资源

——edit by 李家优 虽然HTML5还是很新,没有被所有主要浏览器支持,但现在还是有许多设计师和开发人员使用。毫无疑问,几年下来,HTML5将对web开发起着很重要的作用。我注意到很多人都在使用...

AS3 库资源 很多非常有用的类库

看到了别人进行收集的相关库链接,正好也在进行flash游戏的学习和制作,先备份一下相关类库,稍后再进行整理。 1、as3ebaylib http://code.google.com/p/as3eb...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:HTCondor 有用的资源
举报原因:
原因补充:

(最多只允许输入30个字)