根据软件板块数据,考虑类别时可以使用kmeans等分类算法,而不考虑分类则可以使用pca类算法查看主要成分。本次项目涉及到下图中的两个板块,下次文章再去涉及下图其他两个板块。
PCA算法实践与主成分个数选择
主成分分析之前查看相关性,剔除相关性高的项,可以提高主成分分析有效性。本数据中多重共线性不严重,不用剔除数据。
根据软件板块数据,考虑类别时可以使用kmeans等分类算法,而不考虑分类则可以使用pca类算法查看主要成分。本次项目涉及到下图中的两个板块,下次文章再去涉及下图其他两个板块。
主成分分析之前查看相关性,剔除相关性高的项,可以提高主成分分析有效性。本数据中多重共线性不严重,不用剔除数据。