keras计算机内存不足,在keras.preprocessing.text中使用Tokenizer时内存不足

最新推荐文章于 2022-10-25 22:29:14 发布

阿尔泰Turk

最新推荐文章于 2022-10-25 22:29:14 发布

阅读量184

点赞数

文章标签： keras计算机内存不足

我想用keras建立一个RNN模型来对句子进行分类。

我尝试了以下代码：

docs = []

with open('all_dga.txt', 'r') as f:

for line in f.readlines():

dga_domain, _ = line.split(' ')

docs.append(dga_domain)

t = Tokenizer()

t.fit_on_texts(docs)

encoded_docs = t.texts_to_matrix(docs, mode='count')

print(encoded_docs)

但得到了一个MemoryError。似乎我无法将所有数据加载到内存中。这是输出：

Traceback (most recent call last):

File "test.py", line 11, in

encoded_docs = t.texts_to_matrix(docs, mode='count')

File "/home/yurzho/anaconda3/envs/deepdga/lib/python3.6/site-packages/keras/preprocessing/text.py", line 273, in texts_to_matrix

return self.sequences_to_matrix(sequences, mode=mode)

File "/home/yurzho/anaconda3/envs/deepdga/lib/python3.6/site-packages/keras/preprocessing/text.py", line 303, in sequences_to_matrix

x = np.zeros((len(sequences), num_words))

MemoryError

如果有人熟悉keras，请告诉我如何预处理数据集。

提前致谢！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
keras计算机内存不足,在keras.preprocessing.text中使用Tokenizer时内存不足

我想用keras建立一个RNN模型来对句子进行分类。我尝试了以下代码：docs = []with open('all_dga.txt', 'r') as f:for line in f.readlines():dga_domain, _ = line.split(' ')docs.append(dga_domain)t = Tokenizer()t.fit_on_texts(docs)encode...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。