针对文本之间信息交叉比较严重,导致分类器对某些类别区分能力比较弱的问题,可以引入基于聚类算法(Clustering Algorithm)的混淆类别识别技术,通过消除混淆类别之间的共有特征,以进一步提高分类器的分类性能。 研究混淆类别识别技术