使用Genism进行词向量训练:实践版

最新推荐文章于 2024-04-24 15:17:44 发布

VIP文章空城_招Python数据处理

最新推荐文章于 2024-04-24 15:17:44 发布

阅读量5.2k

点赞数

分类专栏： Deep Learning in NLP 文章标签： NLP wordnetwork word network visualization

本文链接：https://blog.csdn.net/huozi07/article/details/51393934

版权

使用Genism进行词向量训练:实践版

1.语料库准备

输入为一行行正常的语句

2.Code

#!/usr/bin/python
# -*- coding: utf-8 -*-
import gensim.models
import time
import pandas as pd
from nltk.tokenize import TweetTokenizer
time1 = time.time()
import logging
import numpy as np
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
def loaddata(inputfile):
    file = open(inputfile)
    tknzr = TweetTokenizer()
    sentences=[]
    while 1:
        line = file.readline().strip()
        if not line:
              break
        sentences.append(tknzr.tokenize(line))
    return sentences

def WordFr

最低0.47元/天解锁文章

优惠劵

空城_招Python数据处理

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
使用Genism进行词向量训练:实践版

使用Genism进行词向量训练:实践版1.语料库准备输入为一行行正常的语句2.Code#!/usr/bin/python# -*- coding: utf-8 -*-import gensim.modelsimport timeimport pandas as pdfrom nltk.tokenize import TweetTokenizertime1 =...
复制链接

扫一扫