keras1.2.0版本
keras.preprocessing.text.py源码有一点小问题。
如图:
词索引从1开始(0是保留索引,不指向任何词),这里从序列生成矩阵的时候,不应该写到第j列,而应该是第j-1列,因为矩阵下标是从0开始的。所以应该将四个X[i][j]全部改为X[i][j-1]。否则生成的矩阵第一列将全是0。这样以后,还不完美。因为这样矩阵的最后一列全是0,没有有效信息。原因可想而知,前边过滤词的时候肯定用的>=而不是>,所以更改以下部分(全部去掉等于号即可):
keras1.2.0版本
keras.preprocessing.text.py源码有一点小问题。
如图:
词索引从1开始(0是保留索引,不指向任何词),这里从序列生成矩阵的时候,不应该写到第j列,而应该是第j-1列,因为矩阵下标是从0开始的。所以应该将四个X[i][j]全部改为X[i][j-1]。否则生成的矩阵第一列将全是0。这样以后,还不完美。因为这样矩阵的最后一列全是0,没有有效信息。原因可想而知,前边过滤词的时候肯定用的>=而不是>,所以更改以下部分(全部去掉等于号即可):