通过word2vector建立语料模型model后,想要得出所有model的词以及对应向量坐标。我想要的效果是对应的词后面有对应的20个向量代表的坐标,可以轻松写入dict,但是几千个语料词需要通过Excel看,因此可以将数据全部导入csv格式:
首先,需要在model中一个词遍历全部向量,因为单单model[‘word’]得到的向量往往会在python中显示不全,以…代表了,所以要去掉省略号的话,需要将每一个word的向量再遍历。
def vec(x,model):#x是model中的每一个维度或者就叫语料的词
p=model[x] #p是每一个维度/词的向量坐标
st=[{x}] #将词x变成一个整体的list
for i in p:
#遍历x的所有向量,并且添加在x词后,成一个list
st.append(i)
return st
刚开始菜鸟如我,字符串x想要变成一个list后面以便append数组&#