一.count-based word vectos
1.co-occurrence matrix
求出corpus的词频矩阵
注意:每句话的开头结尾都加上了start,end标识符
2.distinct words
计算出所有不同词
3.reduce_to_k_dim
应用SVD方法将co-occurance matix降维
一.count-based word vectos
1.co-occurrence matrix
求出corpus的词频矩阵
注意:每句话的开头结尾都加上了start,end标识符
2.distinct words
计算出所有不同词
3.reduce_to_k_dim
应用SVD方法将co-occurance matix降维