SPSSPRO数据处理的通用方法介绍(上) 适用场景:哑变量化会减少统计建模的自由度(df)参数,其体现为把某一个分类型变量各个值对应的权重都增加某一数值,同时把另一个分类型变量各个值对应的权重都减小某一数值,而模型不变,一般应用在不使用正则化的回归/分类模型。检查与剔除无效样本,个案实际就是单个样本,一个样本由有限个变量的数据集组成,个案处理是对众多样本的变量数据集进行校验检测,筛除无效样本(含重复),是对行的标记处理。纵向用缺失值上面的值替换缺失值、纵向用缺失值下面的值替换缺失值、若某行全为缺失值,剔除所在行、固定值M填充。