word2vector java使用_word2vector调用

1.word2vec模型训练

import jieba.analyse

import jieba

import os

from gensim.models.word2vec import Word2Vec

dirname = './data/LCQMC'

sentence = []

words = []

for filename in os.listdir(dirname):

with open(os.path.join(dirname, filename), 'r') as lcqmc:

for line in lcqmc:

linedict = eval(line)   #将json字符串转化为json对象

word = linedict['sentence1']

pos = linedict['sentence2']

sentence.append(word)

sentence.append(pos)

with open('./data/data_text', 'r') as f:

for line in f:

sentence.append(line)

print("data_text size:", len(sentence))#sentence存放所有要训练的语料

for string in sentence:

temp = list(string)

str = ''

for ch in temp:

str = str+ch+' '

# print(str)

words.append(str)

#size指定训练的字表示向量大小

model = Word2Vec(words, size=128, window=4, min_count=1, sg=1, workers=2)

model.save('./data/word2vecModel')  #将训练好的模型存放在该代码文件下data目录中word2vecModel文件中

2.word2vec模型的调用

model = Word2Vec.load('./gensim_word2vec/data/word2vecModel')

def wordToVector(words):

result = []

for senarr in words:

temp = []

for i in range(30):  #将一句语句设置固定长度30字,下标低于30的字向量从模型中取,超过的获取128的列向量

if i < len(senarr):

word_vec = model[senarr[i]]  #获取字向量

else:

word_vec = [0 for _ in range(128)]

word_vec = np.asarray(word_vec)

temp.append(word_vec)

# temp = np.asarray(temp)

result.append(temp)

return result

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Word2Vec是一种自然语言处理的算法,用于将文本数据转换为向量表示。Python语言中,可通过gensim中的Word2Vec模块来实现该算法。 情感分析是一种自然语言处理的技术,其目的是从文本中识别出内容的情感倾向。一般而言,情感分析通常被应用于社交媒体、评论系统、新闻报道等场合,并以文本分类或情感极性计算的形式呈现。 在Python中,可以将Word2Vec算法与情感分析技术结合起来,从而识别出文本中存在的情感类别。具体而言,Word2Vec算法可以按照词汇的相似性将文本分组,进而识别出文本中某些关键词出现的频率。通过对这些关键词进行情感分析,就能够得出文本的情感倾向,并且将这些文本划分到积极、消极等不同的情感类别中。 使用python进行情感分析解析时,需要注意几个关键组件,包括数据预处理、文本向量化、情感分析模型等。在数据预处理阶段,需要对文本数据进行清洗、分词等处理,以适应算法的分析要求。在文本向量化阶段,需要通过Word2Vec模块将文本数据转换成向量表示,便于计算机处理。在情感分析模型的运用中,需要结合具体的算法模型,以实现精准的文本分类和情感分类。 总之,python word2vector_python使用word2vec进行情感分析解析,是一种先进而有效的自然语言处理技术,可为社交媒体、企业品牌管理、舆情监测等领域提供有力支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值