SAS：查重

章鱼小丸子~

已于 2024-07-12 16:54:45 修改

阅读量218

点赞数 1

分类专栏： SAS 文章标签：数据分析

于 2024-07-12 16:48:39 首次发布

本文链接：https://blog.csdn.net/weixin_38337955/article/details/140383186

版权

SAS 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

1、使用proc sql中的count函数，选择count>1的记录

data aa;
input id $ a b c;
cards;
001 1 2 20
002 2 3 18
002 2 3 18
003 3 4 35
004 4 5 40
004 4 5 60
006 5 6 40
;
run;

proc sql;
create table aa_dup as
select * from aa group by id,a /*按照group by后的字段查重，id、a相同的记录被筛选出来*/
having count(*)>1;
quit;

2、使用proc sort中的nouniquekey查重

proc sort data=aa out=aa_dup1 nouniquekey;
by id a;/*按照by后的字段查重，id、a相同的记录被筛选出来*/
run;

proc sort data=aa out=aa_dup2 nouniquekey;
by _all_;/*by _all_代表按照数据集中所有的变量查重*/
run;

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

章鱼小丸子~

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

SAS编程基础-数据集操作

weixin_43816210的博客

01-11

1872

1、数据的合并在数据量较大的时候经常会交给不同的人进行录入，这时我们就需要把他们录入的数据合并到一个数据集中，这就是数据合并，分为纵向合并和横向合并。 (1)数据纵向合并纵向合并的语法是（set语句）： data 数据集; set 数据集1 数据集2...; run; set 后面如果只有一个数据集，相当于对该数据集进行复制；数据集选项最常用的有两种：第一种： set 数据集1(i...

查询及删除重复记录的方法

ilsas的专栏

05-25

547

先在表中加一字段RID设为主键自动编号后执行下列语句delete from Table where RID not in (select avg(RID) from Table group by ID)ID为重原表的重复ID 1、查找表中多余的重复记录，重复记录是根据单个字段（peopleId）来判断select *

参与评论您还未登录，请先登录后发表或查看评论

SAS学习（4）——重复数据处理的方法整理

weixin_49282401的博客

10-30

1万+

最近遇到数据中出现重复数据，需要剔除出只出现一次的数据，在讨论过程中发现不止一种方法可以解决问题，在这里将想到的所有方法做一整理，如果有新方法欢迎大家补充。简单编一个示例数据集： data a1; input record_id b1 b2; datalines; 1 2 3 1 1 3 1 2 5 2 3 6 3 2 7 6 7 4 5 3 2 5 8 9 ; run; （1）proc freq 具体代码如下： proc freq data=a1 noprint; table record

查找重复值和删除重复值，排序——PROC SORT 过程

静待花开o0O的博客

06-17

9553

基本格式： DATA = data-set 对哪个数据集进行排序 OUT = data-set 把排序后的数据输出到指定数据集中，此时原数据依然保留。如果不加该选项，排序后的数据集将覆盖原有数据集，这样就找不回原数据了 PROC SORT <DATA = data-set> <OUT = data-set> <nouniquekey> <nodupkey>; BY ...

PROC SORT

weixin_30443075的博客

12-27

1125

PROC SORT DATA=输入数据集 <OUT=输出数据集><选项>; BY 关键变量; RUN; PROC SORT 语法如上，其中在尖括号中的可以不出现，也不会报错。选项中常用的有两种NODUPKEY和NOUNIQUEKEY。功能可以由字面意思帮助记忆，NO-没有，DUP-重复，KEY-关键变量，，，合起来就是数据集中指定的关键变量不...

SAS：频谱接入系统

02-26

频谱接入系统（SAS）这是什么？这是SAS的代码。 SAS的作用是允许在Kelly Hall进行USRP的远程和自主操作。 SAS遵守WinnForum和FCC关于SAS操作的规定。文件结构（需要从01/24/2021开始更新） rx_usrp.py和tx_usrp...

SAS视觉业务分析专业证书：SAS:registered:凭据。掌握SAS:registered:Visual Business Analyst认证所需的技能

02-13

SAS:registered:凭证。掌握SAS:registered:Visual Business Analyst认证所需的技能。您将学到什么如何使用SAS Visual Analytics探索数据如何使用SAS Visual Analytics创建交互式报告如何使用SAS Data Studio...

ratesci-sas:置信区间和检验以进行费率比较

03-19

Rates-sas 置信区间和检验以进行费率比较 rateci-sas包含SAS宏代码，用于计算二项式比例的比率（或风险）差异（'RD'）的得分置信区间，并保证区间和相应的假设检验之间的一致性。 [后续更新可能会将代码扩展为包括...

sas:因子分析实例-附件资源

03-02

sas:因子分析实例-附件资源

lint:整理和格式化SAS:registered:代码

04-14

SAS代码整理和格式化我们的目标是帮助全球各地的SAS开发人员减少代码审查，错误修复和标准争论的时间，而将更多的时间用于提供非凡的业务价值。林亭以下产品使用@ sasjs / lint：只需在VSCode市场中下载SASjs，...

SAS 如何去除重复项，请举例子并给出SAS代码

最新发布

weixin_42593549的博客

02-13

1743

在SAS中，可以使用PROC SORT语句来去除重复项。下面是一个示例代码：proc sort data=test; by var1; run;data test; set test; by var1; if first.var1 then output; run;

SAS数据清洗和加工

Christina

07-25

2561

1.数据合并 1）利用set语句进行纵向合并，用法格式为： data 数据集； set 数据集1（数据集选项）数据集2（数据集选项）…； run; 数据集选项：set 数据集1（in=临时变量1）set数据集2（in=临时变量2）…； set数据集1（rename=（原名1=新名1…））数据集2（rename=（原名1=新名1…））…； ...

SAS 删除重复值观测

AaronPaul的博客

07-05

7785

data test; input a b c; datalines; 1 1 3 1 2 3 1 1 4 1 3 4 1 1 5 ; run; proc sort data = test nodupkey; by a b; run;选取a,b完全一致的观测删除。_all_可以删除两个所有变量完全一致的观测。...

Sas应用之统计多个数据集重复数据量

linuxpassion的专栏

07-24

7417

我的简书：http://www.jianshu.com/p/1f81f76464ef

SAS数据集操作

weixin_42937193的博客

01-08

1万+

数据集操作 1、纵向合并 SAS纵向合并的语句是SET语句，语法格式如下： DATA 数据集; SET 数据集1（数据集选项）数据集2（数据集选项）…; RUN; SET语句作用是将若干个数据集依次纵向连接，并存放语法建立的数据集中。如果SET4语句后面只有一个数据集，此时相当于复制作用，即将SET指定的数据集中的数据复制到DATA语句建立的数据集中。数据集选项最常用的2种： SET 数据集1...

SAS中nodupkey和nodup的区别