炼丹炸锅炉

神经网络炼丹炸锅炉的血泪史:

1、segmentation fault

背景:作者在学习bert,去git下载了google的原始代码,数据集也是自带的CoLA。模型参数为:12层*768隐藏层*12。(无gpu,训练时间:6h)。为了保证xshell推出后不会kill进程,在运行指令后,加上 & 

完整错误如下:

更重要的是前面信息:windows fatal exception: access violation,访问非法。后来发现,是export变量时候,路径没有设置正确(windows下的/\路径不大对劲,以及用于区分目录的\需要和运行时args约定好以保持一致,不要出现目录\\子目录的现象),因此训练时无法打开正确的文件/保存文件到正确目录,也就无法开始训练。

2、查看model.ckpt文件:

import tensorflow as tf
import pprint

newcheck = tf.train.NewCheckpointReader("model.ckpt-0")
print("Print Var")
# 打印所有变量名称
# pprint.pprint(newcheck.debug_string().decode("utf-8"))

print("tensor")
'''
打印tensor,这里的tensor应该是上面debug_string()输出的某个前缀。通过这行代码,可以将某变量参数全部出
'''
pprint.pprint(newcheck.get_tensor(
    "bert/encoder/layer_9/intermediate/dense/bias"))

# 把变量输出其dtype类型
print("get_variable_to_dtype_map\n")
pprint.pprint(newcheck.get_variable_to_dtype_map())
print("get_variable_to_shape_map\n")
pprint.pprint(newcheck.get_variable_to_shape_map())

本处参考了:tensorflow的模型保存文件.ckpt包含什么以及如何读取、并将其转换为Keras的.h5文件_小C的博客-CSDN博客

3、

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值