对于一些标点符号,停用词这些信息对于我们对语义分析基本上没什么作用,比如“一个苹果”和“一些苹果”说的都是苹果,即使没有这些停用词,我们说的还是苹果。因此停用词我们可以直接给丢弃掉。 计算向量相似度:http://blog.christianperone.com/2013/09/machine-learning-cosine-similarity-for-vector-space-models-part-iii/