- 博客(11)
- 收藏
- 关注
原创 Timezone offset does not match system offset: 0 != -32400. Please, check your config files
解决办法链接
2019-10-31 13:22:58 1453
原创 docker运行nginx为什么要使用daemon off
docker 容器默认会把容器内部第一个进程,也就是pid=1的程序作为docker容器是否正在运行的依据,如果docker 容器pid挂了,那么docker容器便会直接退出。讨论链接如果 --restart always docker就会一直重启...
2019-10-31 11:47:36 2899
原创 tensorflow:OOM when allocating tensor with shape[225,256,256,36] and type float on /job:localhost/re
解决办法解决可以使得batch size变小
2019-10-31 10:11:11 3525 1
原创 tensorflow编程思考
1.bilstm的output的len是2,是两个lstm的输出结果,所以fc_w = tf.Variable(tf.truncated_normal([hidden_size*2, num_classes], stddev=0.1), name='fc_w') fc_b = tf.Variable(tf.zeros([num_classes]), name='fc_b')self.log...
2019-10-24 16:45:57 166
原创 docker 配置docker hub
docker的配置文件docker的错误处理docker错误处理方法docker配置文件修改etc/sysconf/docker 文件做一下更改OPTIONS='--selinux-enabled --insecure-registry hub.cloud.ctripcorp.com'DOCKER_CERT_PATH=/etc/docker然后重启: serv...
2019-10-14 14:37:25 1065
原创 BERT和XLNET的对比
学习链接对比方面:1.BERT会使用mask的Word的vector和position而xlnet在训练的时候不使用mask的Word的vector和position2.XLNET使用多种因式分解进行预测。这张图表示什么意思?QUERY和KEY,VALUE表示什么?3.对每层的注意力进行掩码。4.由于不知道预测词的位置,所以需要另外一个模型来预测预测值的位置...
2019-10-09 19:45:23 515
转载 模型蒸馏论文学习
学习链接更加详细的介绍soft target温度T的详细介绍1.使用bert的计算结果来代替one-hot的目标。2.使用T来控制BERT的计算结果的分布学习程度。模型蒸馏github代码with open('data/cache/t_tr','rb') as fin: y_tr = pickle.load(fin)with open('data/cache/t_de'...
2019-10-05 18:27:31 399
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人