根据用户访问的网页,得到用户喜爱的模型如下的步骤:
1、将用户访问的网页,分词处理,去停用词
2、VSM向量空间模型的创建,VSM单词数满足训练集的单词数。
3、使用KNN算法,选择使用余弦距离,计算待分类样本与每一个样本的余弦值。选取最小的K个文本,同时知道它们的类别。
根据用户访问的网页,得到用户喜爱的模型如下的步骤:
1、将用户访问的网页,分词处理,去停用词
2、VSM向量空间模型的创建,VSM单词数满足训练集的单词数。
3、使用KNN算法,选择使用余弦距离,计算待分类样本与每一个样本的余弦值。选取最小的K个文本,同时知道它们的类别。