解决word2vec内存爆炸问题

最新推荐文章于 2022-04-24 02:07:14 发布

Christnowx

最新推荐文章于 2022-04-24 02:07:14 发布

阅读量406

点赞数

分类专栏： python 机器学习深度学习

本文链接：https://blog.csdn.net/weixin_39792418/article/details/114143114

版权

python 同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

深度学习

4 篇文章 0 订阅

订阅专栏

机器学习

3 篇文章 0 订阅

订阅专栏

解决word2vec内存爆炸

1.方法：生成器

import gensim
from gensim.models import KeyedVectors
from gensim.models import Word2Vec

class Sentences(object):
    def __init__(self, corpus):
        self.corpus = corpus

    def __iter__(self):
        with open(self.corpus,'r',encoding='utf-8') as f:
            for line in open(f):
                yield line.split()

def runTraining(input_file,output_file):
    sentences = Sentences(input_file)
    model = gensim.models.Word2Vec(sentences, size=200)
    model.wv.save_word2vec_format(output_file,binary=False)
    model=KeyedVectors.load_word2vec_format(file,binary=False)
    return model

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Christnowx

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
解决word2vec内存爆炸问题

解决word2vec内存爆炸1.方法：生成器import gensimfrom gensim.models import KeyedVectorsfrom gensim.models import Word2Vecclass Sentences(object): def __init__(self, corpus): self.corpus = corpus def __iter__(self): with open(self.corpus,'r
复制链接

扫一扫