keras.preprocessing.text 源码小bug

在Keras 1.2.0版本的`keras.preprocessing.text.py`中,源码存在一个小问题,导致词索引转换为矩阵时出现错误。由于词索引从1开始,矩阵下标从0开始,代码应将所有X[i][j]改为X[i][j-1],以避免第一列全为0。同时,过滤词的条件可能使用了>=而非>,需要修正。此问题可能影响矩阵的最后一列。虽然有这些错误,但Keras依然是一个优秀的工具。
摘要由CSDN通过智能技术生成

keras1.2.0版本

keras.preprocessing.text.py源码有一点小问题。

如图:

词索引从1开始(0是保留索引,不指向任何词),这里从序列生成矩阵的时候,不应该写到第j列,而应该是第j-1列,因为矩阵下标是从0开始的。所以应该将四个X[i][j]全部改为X[i][j-1]。否则生成的矩阵第一列将全是0。这样以后,还不完美。因为这样矩阵的最后一列全是0,没有有效信息。原因可想而知,前边过滤词的时候肯定用的>=而不是>,所以更改以下部分(全部去掉等于号即可):


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值