python读大文件memoryerror_python 内存溢出MemoryError如何解决 word2vec库

使用word2vec训练model的时候内存溢出MemoryError

分好词的文本文件不到1G,200维,真没搞懂为啥会溢出?难道真是train的时候分两次,第一次先加载词库,第二次再训练神经网络,所以超2G了,于是报错?

简单两行代码

sentences =word2vec.Text8Corpus(u'wikichinesepreprocessed.txt') # 加载语料

model = word2vec.Word2Vec(sentences,size=200,workers=multiprocessing.cpu_count())

报错

warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")

UserWarning: detected Windows; aliasing chunkize to chunkize_serial

Traceback (most recent call last):

model = word2vec.Word2Vec(sentences,size=200,workers=multiprocessing.cpu_count())

Python36-32libsite-packagesgensimmodelsword2vec.py", line 503, in init

self.build_vocab(sentences, trim_rule=trim_rule)

Python36-32libsite-packagesgensimmodelsword2vec.py", line 579, in build_vocab

self.finalize_vocab(update=update) # build tables & arrays

Python36-32libsite-packagesgensimmodelsword2vec.py", line 752, in finalize_vocab

self.reset_weights()

Python36-32libsite-packagesgensimmodelsword2vec.py", line 1173, in reset_weights

self.syn1neg = zeros((len(self.wv.vocab), self.layer1_size), dtype=REAL)

MemoryError

尝试过按eachline分行读入,但是不行啊word2vec如果分行读入,一开始不能设置train参数,不知道会成什么样。

如果一开始设置model设置训练参数,就不能添加文本进行再训练

而如果用chunksize之类的分割成多个小文件,也同样面临上面的问题

有其他解决办法没啊?比如修改python的默认内存溢出设置

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Word2Vec是一种自然语言处理的算法,用于将文本数据转换为向量表示。Python语言中,可通过gensim中的Word2Vec模块来实现该算法。 情感分析是一种自然语言处理的技术,其目的是从文本中识别出内容的情感倾向。一般而言,情感分析通常被应用于社交媒体、评论系统、新闻报道等场合,并以文本分类或情感极性计算的形式呈现。 在Python中,可以将Word2Vec算法与情感分析技术结合起来,从而识别出文本中存在的情感类别。具体而言,Word2Vec算法可以按照词汇的相似性将文本分组,进而识别出文本中某些关键词出现的频率。通过对这些关键词进行情感分析,就能够得出文本的情感倾向,并且将这些文本划分到积极、消极等不同的情感类别中。 使用python进行情感分析解析时,需要注意几个关键组件,包括数据预处理、文本向量化、情感分析模型等。在数据预处理阶段,需要对文本数据进行清洗、分词等处理,以适应算法的分析要求。在文本向量化阶段,需要通过Word2Vec模块将文本数据转换成向量表示,便于计算机处理。在情感分析模型的运用中,需要结合具体的算法模型,以实现精准的文本分类和情感分类。 总之,python word2vector_python使用word2vec进行情感分析解析,是一种先进而有效的自然语言处理技术,可为社交媒体、企业品牌管理、舆情监测等领域提供有力支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值