SAS DM数据准备读书笔记5(计算众数Mode)

本文介绍了在SAS数据挖掘中计算众数的重要性和步骤,通过宏参数定义、创建测试数据集以及使用SQL和PROC FREQ的比较,展示了在不同数据量下两种方法的性能差异。在大数据集情况下,建议利用SAS的内置过程进行计算。
摘要由CSDN通过智能技术生成

众数的计算在数据挖掘过程中是一个非常重要的步骤,比例在交易数据中需要统计每个用户最频繁的交易方式是什么。

下面的程序主要使用了MACRO, SQL,其中SQL使用了多重嵌套查询的功能(变态的使用了四重)。如果数据集较大,需要对数据集创建索引,另外,也可将数据集分成子集计算以克服内存限制。

 

【宏参数定义】 主要需要以下几个宏参数,TransDS需要分析的交易数据集,XVar需要计算众数的变量,IDVar编号,OutDS结果输出数据集

 

 

1. 创建测试数据集。其中id对于IDVar,x对应XVar,创建10个id用户,每个用户100个随机值。

 

data temp;
do id=1 to 10;
	do i=1 to 100;
	x=abs(round(10*rannor(0)));
	output;
	end;
end;
drop i;
run;


2.计算每个id用户的x变量中的众数,并将结果输出到result数据集。

/*** Data Preparation for Data Mining Using SAS      by Mamdouh

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值