oracle学习之rownum和rowid

rownum先百度一波https://www.cnblogs.com/xfeiyun/p/16355165.html

rownum是oracle特有的一个关键字。

对于基表,在insert记录时,oracle就按照insert的顺序,将rownum分配给每一行记录,因此在select一个基表的时候,rownum的排序是根据insert记录的顺序显示的。

CREATE TABLE TEST.CC_STUDENT_02 (ID VARCHAR2(256), USERNAME VARCHAR2(22))

INSERT INTO test.CC_STUDENT_02 VALUES(1,1);
INSERT INTO test.CC_STUDENT_02 VALUES(2,2);
INSERT INTO test.CC_STUDENT_02 VALUES(1,1);
INSERT INTO test.CC_STUDENT_02 VALUES(2,2);
INSERT INTO test.CC_STUDENT_02 VALUES(3,3);

注意注意注意对于子查询来说,rownum会重新生成

SELECT  id ,USERNAME ,r1 ,rownum AS r2 FROM ( 
SELECT rowid ,id,USERNAME,rownum AS r1

FROM test.CC_STUDENT_02 ORDER BY id )t

 r1还是我们最开是插入的顺序,就是oracle最初给这5条记录赋予的行数。

r2是因为我们把order by 当作了t表,oracle把这个t表当作一个新的表,再重新赋予了rownum

 如何使用rownum去分页查询或者查询指定行。

1、rownum对于等于某值的查询条件:如果想找到第一条查询数据,可以使用rownum=1作为查询条件,但是想找到第二条查询数据,使用rownum=2则查不到数据,原因是:rownum都是从1开始,但是1以上的自然数与rownum做等于时,都认为是false条件,所以无法查询到rownum=n (n>1的自然数)

SELECT id,USERNAME,rownum AS r1 FROM test.CC_STUDENT_02 
WHERE ROWNUM =1 --只能查到第一行

WHERE ROWNUM =2 --查不到任何数据 

2、rownum对于大于某值的查询条件:要是想查询出第二行以后的记录,直接使用rownum>2是查不出数据的,原因是rownum是一个总是以1开始的伪例,rownum>n (n>1的自然数)依然不成立。可以使用子查询来解决,注意子查询中的rownum必须要有别名,否则还是不会查出记录来,这是因为rownum不是某个表的列,如果不起别名的话,无法知道rownum是子查询的列还是主查询的列。例如:

SELECT id,USERNAME,rownum AS r1  FROM test.CC_STUDENT_02  

WHERE ROWNUM >0 --查出全部数据

WHERE ROWNUM >1 --查不到任何数据

3、rownum对于小于某值的查询条件: rownum对于rownum<n((n>1的自然数)的条件认为是成立的,所以可以找到记录。

注意:对于查询rownum在某区间的数据,必须使用子查询,例如要查询rownum在第二行到第三行之间的数据,包括第二行和第三行数据,那么我们只能写以下语句,先让它返回小于等于三的记录行,然后在主查询中判断新的rownum的别名列大于等于二的记录行。但是这样的操作会在大数据集中影响速度。

SELECT  id ,USERNAME ,r1 ,rownum AS r2 FROM ( 
SELECT id,USERNAME,rownum AS r1   --注意这里要取别名

FROM test.CC_STUDENT_02   t1

WHERE ROWNUM <4
)t2
WHERE r1>1  --上面不取别名 这里写rownum是t1还是t2的呢?

4、rownum和排序 Oracle中的rownum的是在取数据的时候产生的序号,所以想对指定排序的数据去指定的rowmun行数据就必须注意了。

其实这里就是说你是想要insert的排序的rownum还是你自己定义的排序规则。

实战分析

 说说我遇到和rownum遇到的一个问题。

我向对方发http请求,对方从oracle数据返回500条数据,总数据大概有5w条,我每获取500条数据就落地写到hdfs,然后500一追加,一般几分钟就跑完了。突然有一天别人反馈我这边数据重复了,我就惊呆了,查询hdfs数据确实重复了。

那么此时有个问题,是我写重复了还是数据库重复了,先要别人查了下,数据库是ok的

那么我开始自己检查,突然发现比如第300-310 共10条数据和第1300-1310的10条数据是重复的。这个时候又有问题,是我程序写错了,还是对方传错了?

后来检查的时候是发现没有order by (还是order by month)就用了rownum,导致这500数据不稳定,有时候会重复。

说下原因 如果你没有order by 系统还是默认有个排序规则。或者你order by month(这个比较通用的字段 例如 sex vip) 这种排序是很容易出现问题的!!!!

当时排查就是发现他没有order by 。。 后面select* from table order by month,name,id 就好了,总之尽可能的保证排序的唯一性。当然你要是前端展示无所谓,重复就重复了,谁还记得第1页和第100页的数据是否重复。

rowid 照例先百度一波。Oracle中的rowid

ROWID是ORACLE中的一个重要的概念。用于定位数据库中一条记录的一个相对唯一地址值。通常情况下,该值在该行数据插入到数据库表时即被确定且唯一。ROWID它是一个伪列,它并不实际存在于表中。它是ORACLE在读取表中数据行时,根据每一行数据的物理地址信息编码而成的一个伪列。所以根据一行数据的ROWID能找到一行数据的物理地址信息。从而快速地定位到数据行。数据库的大多数操作都是通过ROWID来完成的,而且使用ROWID来进行单记录定位速度是最快的。

说的有点多,个人理解,其实可以把rowid看作是该条数据存放的物理地址,在这张表内是唯一的(感觉是在整个数据库也是唯一的)。 也可以理解为java中每个对象在堆中地址值,地址唯一,但是你不知道地址是哪里,

Oracle中的rowid  这篇文章详细介绍了rowid的每个字母都代表啥。。

接着来说rowid有什么用?

 oracle数据库中存在两条相同的数据,怎么删除其中的一条呢 比如删除第二条id=1的数据?

 使用rownum我好像想不出来怎么删

这个时候就可以用rowid了,因为他代表的是每条数据的唯一值,可以间接性的看作是mysql的主键。

DELETE FROM test.CC_STUDENT_02 cs  WHERE rowid ='AAKIY/ACnAAAWxjAAC'

其实在这里就rowid就相当于唯一键。

那么问题来了,如果有多条重复数据怎么同时删除所有重复的数据呢? 

删除思路参考 rowid的作用 

思路就是 找到相同的id和name的最大rowid 然后not in

DELETE FROM test.CC_STUDENT_02 t1 WHERE rowid NOT IN (SELECT max(rowid) FROM test.CC_STUDENT_02 t2 WHERE t1.id=t2.id AND t1.USERNAME=t2.USERNAME )

delete from emp where rowid not in (select max(rowid) from test.CC_STUDENT_02 group by id,name)

 

差不多懂了一点基础的用法。那么我现在有个问题,rowid 代表的这条数据的唯一性,而且rowid只存在于oracle,现在我把oracle数据迁移到hive了,怎么替代rowid呢?

目前就想到一个hash(*) 和一个把所有rowid也导入到hive。

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: ROWNUMROWIDOracle 数据库中两个重要的行号列。 ROWNUM 是一个展示在结果集中行的逻辑序号。它在查询中被赋值,并且只在查询输出中可见。 ROWID 是一个指向数据库表中每一行的系统分配的地址。它是一个二进制值,可以用来直接访问表中的行。 总而言之, ROWNUM 是在查询结果中给每行赋予的逻辑编号,而 ROWID 是数据库给每行赋予的物理地址。 ### 回答2: Oracle数据库的rownumrowid是两个不同的概念,它们有着不同的意义和用法。 Rownum是一种伪列,它不是数据库表中的实际列,而是Oracle数据库在执行查询时为了方便排序、筛选和分页而自动创建的一列。Rownum代表每行数据在结果集中的行号,从1开始逐行递增,但它不受排序影响,在数据库写入和读取行时不作任何保证。在select语句中使用where子句或order by子句时,rownum常用来控制查询结果的范围,如限制查询前10条记录: SELECT * FROM (SELECT * FROM mytable WHERE ROWNUM <= 10) WHERE ROWNUM >= 1; 需要注意的是,rownum只能在select语句的where子句和order by子句中使用,在其他地方使用会报错。 Rowid是一种实际的物理地址,它是Oracle数据库中每一行数据在表中的唯一标识符。Rowid由数据块地址、行号和行标识符组成,可以用来定位表中的具体行数据。由于数据块地址和行号是有序的,所以rowid可以用来优化查询性能和加速数据访问。在有些情况下,rowid也可以用来作为更新或删除数据的条件,但要注意避免行迁移造成的问题。 总的来说,rownumrowid是两个截然不同的概念,rownum是虚拟的行号,用来控制查询结果的数量和范围,而rowid是物理的行标识符,用来定位具体的行数据。 ### 回答3: Oracle 中的 ROWNUMROWID 是两个不同的概念和用法,下面详细介绍它们之间的区别: ROWNUM ROWNUMOracle 中的一个伪列,数值类型,类似于行编号。它是在查询结果返回给用户之前分配给查询结果集中的每一行的。也就是说,查询返回的结果集格式是先有 ROWNUM,再有其它字段。 ROWNUM 的值是从1开始顺序递增的,不会重复,可以在查询语句中使用 WHERE ROWNUM < x 的条件来限定结果集的行数。 注意:ROWNUM 只在查询结果被返回给用户之前分配给每一行,一旦结果被返回给用户,ROWNUM 值就固定下来了。因此,不能使用 WHERE ROWNUM > x 来限制行数,因为它会返回一个空结果集。 ROWID ROWIDOracle 中的一个伪列,标识着表中每一行的物理存储位置,在表的数据块中唯一标识一行数据。 每行数据在物理存储位置上都有一个唯一的 ROWID 值。ROWID 的值由 Oracle 自动分配给每一行数据,具有唯一性和不变性。 ROWID 可以在查询语句中使用 WHERE ROWID = 'AAAT1zAABAAAAGNAAB' 来更新或删除一行数据,也可以使用它来定位查询结果集中一行数据的物理存储位置。 区别 1.ROWNUM 是一个伪列,ROWID 是一个伪列。 2.ROWNUM 是在查询结果返回给用户之前分配给查询结果集中的每一行,ROWID 是标识表中每一行的物理存储位置。 3.ROWNUM 的值是从1开始顺序递增的,不会重复,不能作为唯一标识;ROWID 的值由 Oracle 自动分配给每一行数据,具有唯一性和不变性。 4.ROWNUM 在限定结果集的行数时很有用,ROWID 在使用时必须有相应的权限。 总体来说,ROWNUM 主要用于限制结果集的行数,ROWID 主要用于定位一行数据的物理存储位置,它们之间的区别和用法一定程度上也是互补的。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值