今天的内容较为简单,希望英雄们看的愉快。
我们使用的依然是state.x77数据集,她含有美国50个州在1977年的Population(人口)、Income(收入)、Illiterate(文盲率)、Murder(谋杀率)、Frost(结霜率)等。
#查看数据集
head(state.x77)
删除离群点可以提高数据集对于正态性的假设,强影响点会干扰结果,通常也会被删除。
删除最大离群点和强影响点后,模型需要重新拟合,如果离群点和强影响点仍然存在,重复以上过程,直到他们不再存在。
这是我们的底线,面对敌营异常值,要么改变他们,要么摧毁他们。
删除观测点的方法简单粗暴。
当模型不符合正态性、线性或同方差性假设时,对变量进行变化或许会改善模型效果,用爱去感化那些异常值。
car包中的 powerTransform( ) 函数通过最大似然估计来