![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
weixin_40954107
这个作者很懒,什么都没留下…
展开
-
SAS代码-运用宏做分类变量热独编码
%let lib=weier;%let target=y;%let id=uid;%macro oh_class(dsin,dsout);/*one-hot for var of class*/data credit_model;set &lib..&dsin;run;proc sql noprint;select name into :vard separ...原创 2019-10-29 09:51:45 · 456 阅读 · 0 评论 -
SAS代码-决策树法选择变量重要性输出
%let lib=temp;data credit_model;set &lib..credit_model;run;%let NumSamples = 5; /* number of bagging resamples *//* 2. Generate many bootstrap samples */proc surveyselect data=credit_...原创 2019-10-29 09:36:41 · 1907 阅读 · 0 评论 -
XGBoost缺失值引发的问题及其深度分析
1. 背景XGBoost模型作为机器学习中的一大“杀器”,被广泛应用于数据科学竞赛和工业领域,XGBoost官方也提供了可运行于各种平台和环境的对应代码,如适用于Spark分布式训练的XGBoost on Spark。然而,在XGBoost on Spark的官方实现中,却存在一个因XGBoost缺失值和Spark稀疏表示机制而带来的不稳定问题。事情起源于美团内部某机器学习平台使用方同学的反...转载 2019-10-29 08:57:55 · 366 阅读 · 0 评论 -
SAS代码-商品对应分析
一、数据字段(此数据来源于网络)二、运用SAS做商品对应分析非常简单几行命令搞定%macro dyfx(infile,var);PROC CORRESP mca ALL DATA=&infile OUTC=COOR1;/*对应分析,寻找行(客户特征)和列(产品特征)的关系*/tables &var. ;run;%plotit(data=COOR1,dataty...原创 2019-10-21 19:43:56 · 979 阅读 · 0 评论 -
SAS宏代码-运用决策树计算最佳分箱数
在运用逻辑回归-计算 WOE值时,需要对变量进行分箱,如何计算最佳分箱数呢,本例采用决策树法对连续变量计算最佳分箱数。%let lib=temp;data credit_model;set &lib..credit_model_ch5;drop target_mode home_n_mode;run;%macro creat_binnum(dsin,dvvar,dsout);...原创 2019-10-16 11:29:48 · 2019 阅读 · 0 评论 -
一张图看清客户价值-运用Tableau作RFM客户价值分析(二)
在上一篇已经简单的对RFM客户价值图进行了分析,如何运营TABLEAU对流失客户状态进行更详尽的分析呢上图,是将消费券占比作为气泡大小,下图结合注册时间和最后一次消费时间来分析流失用户的生命周期状态1、左图结合用户的注册时间,最下部分红色的流失客户,有一些注册时间较早的老用户,需要从产品和运营角度思考为什么他们会流失。2、同时结合右图可以发现这里面有些消费频率较高的,消费金额较...原创 2019-10-16 10:00:12 · 918 阅读 · 0 评论 -
商业分析-FAST指标解读
本文精选自【前瞻经济学人APP】作为一个面向行业用户,可以交流的资讯平台,前瞻经济学人APP提供行业深度资讯,有数据有行研报告、有实时产经新闻也有全球趣闻动态。数字化导向下,消费者管理体系从GMV转向FAST随着线上销售的渗透率逐渐提高,传统的流量运营已经无法满足中国电商消费品与零售行业长期发展战略的要求了。如何在传统流量运营之上挖掘消费者价值成为了品牌商和阿里巴巴数字化平台共同的奋斗...转载 2019-10-15 10:08:38 · 8090 阅读 · 0 评论 -
SAS代码-暴力衍生新变量
本文是原创文章,转载请注明;在实际数据挖掘建模过程,如果已有的变量也目标变量相关性不强,可以有多种衍生变量的方法,本代码提供一种暴力衍生的方式,对相关性最强的变量进行随机抽取,可按多种方式进行衍生,并选择与目标变量最相关度前n个变量入训练集,并映射到测试集。代码在9.4m2环境测试可用。%let lib=weier;%let target=y;%let id=uid;data c...原创 2019-10-14 19:50:19 · 937 阅读 · 0 评论 -
SAS代码-Adaboost提升树
转一个国外大牛的代码/* Real AdaBoost: a boosting library for binary classification ----- Paul Edwards (paul.edwards2@scotiabank.com, edwardsp@allmail.net) -- Comments, questions, bug reports and ...转载 2019-10-14 18:22:32 · 726 阅读 · 0 评论