inst2vec的实验中,有许多难以理解的数据处理操作
比如,对数据进行shuffle,对参数进行l2正则化,截断地产生正态分布随机数,对bias置为0,
代码难以理解的原因:
采样上的策略,对为何采用这样的策略不是很清楚
各种参数的影响:FLAGS的锅
TensorFlow API的影响:TensorFlow中Tensor的形状
疑点:
- 在从rec文件中读取文件内容之后,进行map可以理解,之后进行shuffle时,传入的参数
int(1e5)
是什么含义? - 之后,使用dataset.apply方法将大数据集分成小batch可以理解,但是下一行的prefetch方法,将参数设置为
int(100000000)
是何含义? - 往下,Input_Data区域,next[:, 0]和next[:, 1]分别是代表什么?
- 正常的shape表示都应该是小括号,为什么tf.reshape在传参数的时候,shape是一个中括号括住的list?
- 另外还是这两行代码,rec文件这样一个二进制文件的内容可以用vim读出来,但这又是什么含义?
- TensorFlow的图定义和执行分离,参考博客