余弦相似度 可以用于计算两篇文章的相似情况。 步骤: 一、每篇文章各取出若干个关键词,合并成一个集合 二、计算每篇文章对于这个集合中的词的词频 三、生成两篇文章各自的词频向量;生成两篇文章各自的词频向量 四、计算两个向量的余弦相似度,值越大就表示越相似。计算两个向量的余弦相似度,值越大就表示越相似。