Ubuntu 18.04+JupyterHub的NFS服务 Bug 修复

在Kubernetes1.11.2上,使用Ubuntu 18.04+JupyterHub出现jupyterhub_cookie_secret无法写入的错误。

1、问题现象

JupyterHub的Hub Pod启动失败,查看日志如下:

[I 2018-08-12 10:27:52.280 JupyterHub app:1656] Using Authenticator: dummyauthenticator.dummyauthenticator.DummyAuthenticator
[I 2018-08-12 10:27:52.280 JupyterHub app:1656] Using Spawner: kubespawner.spawner.KubeSpawner
[I 2018-08-12 10:27:52.281 JupyterHub app:1053] Writing cookie_secret to /srv/jupyterhub/jupyterhub_cookie_secret
[E 2018-08-12 10:27:52.281 JupyterHub app:1941]
    Traceback (most recent call last):
      File "/usr/local/lib/python3.6/dist-packages/jupyterhub/app.py", line 1938, in launch_instance_async
        await self.initialize(argv)
      File "/usr/local/lib/python3.6/dist-packages/jupyterhub/app.py", line 1662, in initialize
        self.init_secrets()
      File "/usr/local/lib/python3.6/dist-packages/jupyterhub/app.py", line 1055, in init_secrets
        with open(secret_file, 'w') as f:
    OSError: [Errno 22] Invalid argument: '/srv/jupyterhub/jupyterhub_cookie_secret' 

2、原因分析

经初步测试,这是Ubuntu操作系统和Kubernetes新版本升级后所致,升级NFS的服务Pod即可。

3、解决办法

将NFS-provisioner的Images设为最新的版本v2.1.0-k8s1.11,获取镜像:

docker pull quay.io/kubernetes_incubator/nfs-provisioner:v2.1.0-k8s1.11

如果访问有问题,可以从阿里云上获取镜像的拷贝:

MY_REGISTRY=registry.cn-hangzhou.aliyuncs.com/openthings

docker pull ${MY_REGISTRY}/quay-io-nfs-provisioner:v2.1.0-k8s1.11

docker tag ${MY_REGISTRY}/quay-io-nfs-provisioner:v2.1.0-k8s1.11 quay.io/kubernetes_incubator/nfs-provisioner:v2.1.0-k8s1.11

编辑NFS服务的statefull-set的启动参数:

获取sts(Stateful Sets) id
kubectl get sts -n nfs

#编辑images参数,设为v2.1.0-k8s1.11
kubectl edit sts/nfs-server-nfs-server-provisioner -n nfs

#按i进行编辑,按esc : w保存,按:q退出。 

#查看
kubectl describe sts/nfs-server-nfs-server-provisioner -n nfs

然后,删除pod,等kubernetes 自动重建pod后,刷新pod状态变绿,应该就可以正常使用了。

4、测试验证

到原来的Data8(基于JupyterHub的部署)查看pv,已经状态显示为绿色,可以使用。

然后重新部署IPFS为NFS存储方式,发现pvc一直处于pending状态。创建一个新的pvc测试一下,也是如此。经过多次测试发现,新的这个NFS部署放在default命名空间没有问题,其它的就会有问题。需要进一步测试和改进。

5、最终解决

经过排查,问题发现主要是命名空间和访问权限导致创建pv失败。NFS-provisioner的原始实现在 https://github.com/openthings/external-storage/tree/master/nfs ,其中deploy/kubernetes目录包含部署用的配置文件,解决办法如下:

  • 修改rbac.yaml里面的namespace为最终想要部署的命名空间为nfs2x,然后在 kubectl 命令后加-n nfs2x指定命名空间,nfs2x是我设定的命名空间。
  •  将所有的配置文件全部指定命名空间。nfs2x是我设定的命名空间,storageclass设为openthings-nfs。

然后,运行安装脚本install-dep.sh(部署为deployment),内容如下:

kubectl create ns nfs2x

kubectl apply -f deployment.yaml
kubectl apply -f class.yaml
kubectl apply -f rbac.yaml

然后,创建pvc:

kubectl apply -f claim.yaml 

6、更进一步

目前上面的解决办法是采用yaml文件使用kubectl部署的,以后应改进、更新helm chart的部署,以及支持GitOps的部署管理方法。

转载于:https://my.oschina.net/u/2306127/blog/1940604

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值