在对原始数据进行基本处理的时候,经常需要用到的是去除重复数据,补充不完整数据,处理异常数据,以及数据标准化及权重。
本文将介绍数据标准化及权重的方法
1.Min-Max标准化:新数据=(原数据-极小值)/(极大值-极小值)
即把数据都归一到0-1的区间进行比较。
2.使用标准分进行标准化: 标准分 = (原始分-平均分)/ 标准差
比如一次语文考试,有的同学考了58分有的同学考了60分,还有的同学考了98分,那么是不是考了58分的同学就一定是很差的呢,会不会是题目出你的太难了,所以使用标准分进行标准化很有必要。
3.加权平均
略。。。。
回归分析的大概讲
因子分析获取最优解:
最优回归方程是当
使用excel计算各列数列之间的相关系数时,选定的分析区域应该是要包括表头文字的。如果不包括表头文字,那得到的结果会不一样。这个得出来来的每两列之间的相关系数,用矩阵来呈现。