前言
构建网络的基础要素有两个,节点和节点间的联系。
初始数据集存在的情况下,节点间的一层联系就可以通过最基础的共现概率求得。
再往深就到剖析节点间的二层联系的时候了。
word2vec词向量训练
Word2Vec是谷歌在 2013 年推出来的一个自然语言处理工具,可用来计算文本的词向量,从而实现定量的度量词与词之间的关系。
本篇使用gensim库中现成的word2vec模型训练词向量,需要准备的只是语句集和参数。
语句集示例
假定初始数据列表为
单次购置商品 |
---|
A,B |
B,C |
C,D |
E,B,F |
D,E |
那么转换后的语句集就为
sentences = [[A,B],[B,C],[C,D],[E