炼丹炸锅炉

0x3fffffff

于 2021-12-07 10:17:04 发布

阅读量135

点赞数

分类专栏： GNN 文章标签：神经网络人工智能深度学习

本文链接：https://blog.csdn.net/guanjian6334/article/details/121762300

版权

GNN 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

神经网络炼丹炸锅炉的血泪史：

1、segmentation fault

背景：作者在学习bert，去git下载了google的原始代码，数据集也是自带的CoLA。模型参数为：12层*768隐藏层*12。（无gpu，训练时间：6h）。为了保证xshell推出后不会kill进程，在运行指令后，加上 &

完整错误如下：

更重要的是前面信息：windows fatal exception: access violation，访问非法。后来发现，是export变量时候，路径没有设置正确（windows下的/\路径不大对劲，以及用于区分目录的\需要和运行时args约定好以保持一致，不要出现目录\\子目录的现象），因此训练时无法打开正确的文件/保存文件到正确目录，也就无法开始训练。

2、查看model.ckpt文件：

import tensorflow as tf
import pprint

newcheck = tf.train.NewCheckpointReader("model.ckpt-0")
print("Print Var")
# 打印所有变量名称
# pprint.pprint(newcheck.debug_string().decode("utf-8"))

print("tensor")
'''
打印tensor，这里的tensor应该是上面debug_string()输出的某个前缀。通过这行代码，可以将某变量参数全部出
'''
pprint.pprint(newcheck.get_tensor(
    "bert/encoder/layer_9/intermediate/dense/bias"))

# 把变量输出其dtype类型
print("get_variable_to_dtype_map\n")
pprint.pprint(newcheck.get_variable_to_dtype_map())
print("get_variable_to_shape_map\n")
pprint.pprint(newcheck.get_variable_to_shape_map())

本处参考了：tensorflow的模型保存文件.ckpt包含什么以及如何读取、并将其转换为Keras的.h5文件_小C的博客-CSDN博客

3、

0x3fffffff

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
炼丹炸锅炉

神经网络炼丹炸锅炉的血泪史：1、segmentation fault背景：作者在学习bert，去git下载了google的原始代码，数据集也是自带的CoLA。模型参数为：12层*768隐藏层*12完整错误如下：更重要的是前面信息：windows fatal exception:access violation，访问非法。后来发现，是export变量时候，路径没有设置正确（windows下的/\路径不大对劲），因此训练时无法打开正确的文件/保存文件到正确目录，也就无法开始训练。2、查.
复制链接

扫一扫

专栏目录