为了方便以后得到数据,就可以get到要从什么地方入手,所以整理PCA降维思路。
主要可以分为以下几步:
一、导入需要的模块和库
二、导入数据,探索数据
三、画累计方差贡献率,找最佳降维后维度的范围
四、降维后维度的学习曲线,继续缩小最佳维度的范围
五、细化学习曲线,找出降维后的最佳维度
六、导入找出的最佳维度进行降维,查看模型效果
七、如果维度已经降下来了,可以考虑利用KNN观察一下模型的效果。
八、利用KNN的k值学习曲线,寻找最佳k值
九、根据定下的参数,观察模型效果如何。