主成分分析就是一大堆因素可能都指向一个原因,但是没有太多的CPU,能不能挑几个因素进行计算。也就是选出代表来。
影响因素有20个,现实中20个因素选上X1……Xn个,但在主成分分析的世界,他模仿这20个因素,自己创造出主成分Z1……Zm,m一定远小于n,这样才有价值,但是Z1……Zm不在X1……Xn之中,这就是主成分分析对信息加工的魅力,缺乏维生素B1-B16,你可以吃16个药丸,也可以选择吃一顿精选套餐,该套餐借助主成分分析这个工具来加工,营养基本都包住了,注意我的措辞,是基本不是100%,但是这是你可以接收的损失,除非你不想。
化繁为简,夸张的说本来模型是20入1出,现在变成3入1出,你说香不香,计算量是不是就下来了。那这三个从哪里来的。是PCA中的计算,如果创造出的Z1,Z2,Z3能包含95%的特征就可以选择接受。3个的主成分没找到图,我拿5个的来说吧。
5个主成分都快接近100%了,加上剩下15个主成分一定能实现100%。可那真是你想要的数据么?
20个怎么变成3个,可以用神经网络实现也可以用其他的方式,20个维度输入,3个Z1、Z2、Z3为输出,这样3个不就出来了。
这三个的加减乘数及复杂数学组合,一定能接近你的控制目标值得。
受《基于PCA⁃LSTM的轴承退化趋势预测》、《基于 PCA 和多元回归算法构建大棚黄瓜霜霉病预警系统》启发。