技术特征:
1.一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法,其特征在于:包括以下步骤:
s1:对文本数据进行预处理,得到预处理后文本数据;
s2:采用余弦角度为相似性度量,分别计算预处理后文本数据向量中的每一个数据对象到每一个初始灰狼个体的初始聚类中心点间的距离,并按相似度最接近的原则,分别将预处理文本数据中的数据对象分配到对应的k个类簇中,直到所有的数据对象分配完毕,形成k个类簇;再计算下一个灰狼个体的数据分配结果,直到灰狼种群中所有的灰狼个体都计算完毕,得到n种初步文本聚类结果;
s3:分别计算每一个灰狼个体到数据中心点间的距离之和,分别得到了n个灰狼个体的适应度评估函数值;
s4:对n个适应度评估函数值进行按序排列,选出适应度评估函数值最小的前三只狼作为α狼,β狼,δ狼;并根据α狼,β狼,δ狼三只狼的位置,计算灰狼种群中其他灰狼个体到这三只狼的距离,并计算其余灰狼个体位置更新的中间变量的值;s5:将带有粒子群位置更新思想的所有灰狼个体进行位置更新;
s6:判断粒子群位置更新思想改进的灰狼优化算法的k-means聚类算法是否达到最大迭代次数,如果否,则执行步骤2;如果是,输出α狼的适应度值及其位置xα,根据xα聚类中心得到的最终文本数据分配结果。
2.根据权利要求1所述的一种基于粒子群位置更新思想灰狼优化算法的k-means文本分类方法,其特征还在于:所述文本数据进行预处理步骤如下:
s1&#