因为以前用的都是MySQL,对Oracle了解并不是太深,所以使用Oracle遇坑
在工作中,有一个很复杂的业务逻辑,需要用到四张表,分别是contract,contractrevision,btv,variables。
其中contract和contractrevision需要join拿出所有合同。再利用variables定义的153个字段与前两个表字段进行拼接,153个字段需要从btv表中取值,并且需要行转列,btv表中有1亿3千多万条数据,所以数据量很大。取出的结果需要根据合同id和合同版本号进行分组,然后将153个字段进行合并,并且确定合并后不会出现两条数据。
在Oracle中使用group by 时,所有select后面的字段都要放到group by 后面,除非使用分析函数。。。
sql语句有两种写法:
1.first_value() over() :取出分区中第一条记录的字段值,partition by 可选,order by 可选
select ename,first_value(salary) over(partition by job order by salary desc)
但是这种方法被我排除掉了,因为超级慢,一亿多条数据跑了三个小时,最后报了一个临时表空间不足,最后让组长加了100G的临时表空间,又补充了Oracle的物理空间,然后我又优化了一下sql,就是第二种方法。
2,max() : 取分区的最大值,对象可以是字符串,根据字典排序。
这种方法比第一种方法好一点,速度比第一种方法快很多,大概一个多小时就能跑完这一亿多条数据,如果Oracle临时表空间不足,可以添加临时表空间。如果加不了,那就分字段进行合并,然后再进行join。