本项目是数据的聚类分析,针对2014年AAAI收到的所有论文数据集[UCI] AAAI-14 Accepted Papers - Papers进行样本的聚类分析。首先进行特征转换,将数据集按照作者选定的高级关键词进行展开,然后分别用k-means、高斯混合模型、贝叶斯高斯混合模型对数据集进行聚类分析。并对聚类结果采用词云的方式进行可视化分析。最终得到贝叶斯高斯混合模型的聚类效果最好,将数据集聚为3簇时,轮廓系数最大。
src="https://nbviewer.jupyter.org/github/wzy6642/Machine-Learning-Case/blob/master/AAAI/code/AAAI.ipynb" width="100%" height="1000">聚类分析
最新推荐文章于 2022-07-30 18:38:43 发布