问题简述
我使用了Dask+CDH集群搭建了一个分布式的服务,今天服务挂了重启时却发现重启不起来了,具体表现为如下情况
E0701 02:17:09.031541082 14823 ssl_transport_security.cc:1229] Handshake failed with fatal error SSL_ERROR_SSL: error:1000007d:SSL routines:OPENSSL_internal:CERTIFICATE_VERIFY_FAILED.
Dask-yarn操作集群的程序时使用了skein包来进行处理,这里发现skein无法正常连接到driver了,在命令行使用skein相关命令都是得到同样的结果,后来在github上看到相关的问题:https://github.com/jcrist/skein/issues/183
解决方法
简单来说就是这台服务器上的skein证书刚好满一年,然后就过期了,可以通过下面路径查看
cd ~/.skein
ls -lh
遇到这个问题把证书更新就是了,你可以直接删除,然后再执行skein driver start时自然会将证书再写到对应路径下
又或者通过skein config gencerts --force
清楚证书缓存,也能达到一样的效果
以上