SAS EM(四)逻辑回归预测模型
作为某商品类目公司的市场分析师,你可能需要为二值目标变量(purchase)建立逻辑回归模型,判断某个顾客是否会产生购买。输入数据集存放在 SAS 安装文件的 SAMPSIO.DMEXA1中,该数据集包含 1966 个顾客观测值信息。它包含 31 个区间变量输入和 18 个分类变量输用于构建模型。该逻辑回归模型产生的打分公式应用在新的数据集中,给那些可能产生购买的顾客发送邮件。
创建流程图
创建数据源输入数据
找到系统内置的表 SAMPSIO.DMEXA1
数据分区
对输入数据集运用层次抽样方法创建训练和验证数据集。训练数据集被用来拟合回归模型,验证数据集用来评估回归模型。层次抽样技术保留购买者和非购买者在训练集和验证集中的初时比率。
首先,在流程图空间加入数据划分节点,打开数据划分节点,在划分选项卡,设置输入数据集的 70%作为训练集,30%作为验证集,测试为 0。
针对类型输入变量 STATECOD,选择层次抽样方法单选按钮。