自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 SAS创建和使用索引(SAS INDEX)

一、概述在合并数据集的时候,可以使用DATA步,但使用DATA 步时需要对KEY VALUE 排序,且KEY VALUE 的名字也必须一致;也可以用PROC SQL ,不需要进行上述排序、重命名的步骤。 当数据量较小时使用哪种方式都不会影响代码的执行效率,但1000万行且存在上百变量时上述code的执行效率严重下降。此时若使用index 则会提高代码运行效率。INDEX 分为简单索引和复杂...

2019-07-05 20:54:56 8978 2

原创 AB Test 确定样本量

AB Test 确定样本量

2024-01-29 18:43:00 598

原创 Python 数据分析实战——社交游戏的用户流失?酒卷隆治_案例2

在导出流失的用户机型数据后,发现系统版本存在问题,在修复系统后用户数据恢复正常。设备类型(iOS、Android) string(字符串) device_type。年龄段(10、20、30、40、50) int(数值) generation。# 从图可知,iOS设备的用户数和之前的大体相同,再一个区间内震荡。性别(女性、男性) string(字符串) gender。应用名称 string(字符串) app_name。用户 ID int(数值) user_id。用户 ID int(数值) user_id。

2024-01-29 18:41:14 536

原创 Python算法——查找(列表查找vs二分查找)

【代码】Python算法——查找(列表查找vs二分查找)

2024-01-26 18:18:26 123 1

原创 Python 数据分析实战——为什么销售额减少?酒卷隆治_案例1

(根据书本的样例数据计算的结果,并不能反应出销售额的下降是由于消费2000元以下的用户数减少,暂且认为是确实部分数据): 根据之间的假设 宣传活动减少,导致新客户数量减少,新客户带来了销售额的下降,建议恢复商业宣传活动到之前的水平。Note: 在实际的工作中,还需要判断ROI,比较新用户的顾客终身价值和商业宣传活动的投入成本,再进行决策。消费日期 string(字符串) log_data。用户 ID int(数值) user_id。用户 ID int(数值) user_id。数据内容 数据类型 字段名。

2024-01-26 18:14:39 631 1

原创 Matplotlib 绘制基本的图表

【代码】Matplotlib 绘制基本的图表。

2023-12-26 15:55:47 403 1

原创 Pandas Dataframe 调整列顺序

【代码】Pandas Dataframe 调整列顺序。

2023-12-20 11:26:13 530 1

原创 SAS' DATA STEP内部逻辑

SAS data step 包含两个阶段,编译和执行阶段,具体流程如下:一般来讲,SAS DATA Step处理的第一阶段是编译阶段,主要执行以下任务:1.自动将SAS语句转换为稍后要执行的机器代码2. 标识变量的类型以及长度3. 确定后续的引用是否需要对变量进行类型转化4. 若存在外部的input语句,则创建输入缓冲区5. 创建程序数据向量(PDV)6. 创建数据集和变量的描述性...

2019-08-12 18:40:09 1282

原创 SAS 时间区间函数 INTNX 和 INTCK

SAS 区间函数 INTNX 和 INTCKINTCK/INTNX 可以对date \ datetime\time 格式的时间进行计算,可以使用SASriqi进行日历计算,可以按照间隔递增计算日期,也可以计算日期之间的时间间隔INTNX(interval,start-from,increment<,alignment>); 按间隔递增时间,不设置format则返回的是数值形式的时...

2019-07-25 21:05:19 19035 1

原创 用 PROC COMPARE 比较两个数据集

一 、可比较的内容如下:1:数据集的属性是否一致2:变量及属性是否一致3:观测是否一致以下时2个用来练习的简单数据集,可运行相应代码查看结果:data one;infile datalines delimiter = ',';input id $ name $ status $ grade $ ;datalines;001,huahua,A,A002,gaga,B,B003...

2019-07-10 22:02:12 13500

原创 SAS 常用快捷键(keyboard shortcut)

SAS 常用快捷键(keyboard shortcut)1. code folding2. Edit3. Navigation4 Selection5 Others1. code folding折叠所有的代码块 : alt + ctrl + -折叠当前的代码块 : alt + -展开所有的代码块 : alt + ctrl +...

2019-07-03 21:23:02 5605

原创 SAS 读取数据文件

每次读取数据时需要告诉SAS3件事:1:数据存在哪里?2:数据的形式3:创建的数据集的类型(永久/临时)1 读取SAS数据集 DATA temp; /*temp 为创建的数据集名称*/ INFILE 'C\mysas\data\temp.dat'; /*数据存放的位置 */ INPUT id 1-4 gender 6 height 8-9 weight 11...

2019-06-26 22:13:55 4522

原创 SAS_调用已保存的宏

SAS_调用已保存的宏方法1: 通过%include 和FILENAME 语句调用宏方法2:通过options 选项调用宏注意事项方法1: 通过%include 和FILENAME 语句调用宏*用filename 语句声明sas macro 文件所在位置;FILENAME monday '‘H:\MACROTEST\BLOG1_CALL_MACRO.SAS’ ;%INCLUDE monda...

2019-05-30 21:07:57 6521 1

personal info

personal info

2024-03-31

物流测试数据, 用来辅助matplotlib 画图使用

物流测试数据, 用来辅助matplotlib 画图使用

2023-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除