既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
当然也支持字符串字段名或数字序号访问字段:
T(1).field(2)
T(1).field(“Client”)
SPL在面向对象方面更加纯粹,风格更统一,编写代码更加方便。此外,SPL提供了很多JOOQ不支持的便利功能:默认字段名,可以用点号直接访问,比如取第2个字段:T(1).#2;取多个字段,返回集合的集合:T.([Client,Amount])
**有序访问**
有序访问是业务逻辑开发的难点之一,JOOQ的记录集合继承自Java的有序集合ArrayList,具备一定的有序访问能力,支持按下标取记录和按区间取记录:
R.get(3)
R.subList(3,5);
再进一步的功能,就需要硬编码实现了,比如后3条:
Collections.reverse®;
R.subList(0,3);
至于按位置集合取记录、步进取记录等功能,硬编码就更麻烦了。
SPL序表同样是有序集合,提供了顺序相关的基本功能,比如按下标取、按区间取:
T(3)
T.to(3,5)
序表是专业的结构化数据对象,许多顺序相关的高级功能JOOQ Result没有支持,序表则直接提供了,比如按倒数序号取记录,可以直接用负号表示:
T.m(-3) //倒数第3条
T.m(to(-3,-5)) //倒数区间
再比如按位置集合取记录、步进取记录:
T.m(1,3,5,7:10) //序号是1、3、5、7-10的记录
T.m(-1,-3,-5) //倒数第1,3,5条
T.step(2,1) //每2条取第1条(等价于奇数位置)
### 结构化数据计算
结构化数据计算能力是数据业务逻辑的核心功能,下面从简单到复杂选取几个常见题目,比较JOOQ和SPL的计算代码。
**改名**
//等价的SQL
select SellerID eid,Amount amt from Orders
//JOOQ
context.select(ORDERS.SELLERID.as(“eid”),ORDERS.AMOUNT.as(“amt”)).from(ORDERS).fetch()
//SPL
Orders.new(SellerID:EID, Amount:amt)
JOOQ的语法逻辑与SQL基本一致,可以达到用面向对象的方式模拟SQL的目的,这是JOOQ的重要优点。相应的也有缺点,JOOQ的一项运算需要多个函数的组合才能实现,每个函数都有自己的参数和语法规则,学习和编写难度较大。此外,很多函数里的字段名必须附带表名,即使单表计算也是如此,这说明JOOQ的语法不够专业,还有很大的改进空间。
SPL直接用面向对象的语法实现计算,一项运算对应一个函数,引用字段不必附带表名,语法更专业,代码更简短。
**条件查询**
//等价的SQL
select * from Orders where
((SellerID=2 and Amount<3000) or (SellerID=3 and Amount>=2000 and Amount<5000))
and
year(OrderDate)>2010
//JOOQ
context.select().from(ORDERS)
.where(
((ORDERS.SELLERID.equal(2).and(ORDERS.AMOUNT.lessThan(3000.0)))
.or((ORDERS.SELLERID.equal(3).and(ORDERS.AMOUNT.greaterOrEqual(2000.0).and(ORDERS.AMOUNT.lessThan(5000.0))))))
.and(year(ORDERS.ORDERDATE).greaterThan(2012)))
.fetch();
//SPL
Orders.select(
((SellerID2 && Amount<3000) || (SellerID3 && Amount>=2000 && Amount<5000))
&&
year(OrderDate)>2010)
SQL的条件表达式本身足够简单,JOOQ虽然在模拟SQL,但对条件表达式进行了过度封装,函数数量过多,多层括号难阅读,远不如SQL好理解。SPL用一个函数实现条件查询,条件表达式简短易读。
**分组汇总**
//等价的SQL:
select Client, extract(year from OrderDate) y,count(1) cnt
from Orders
group by Client, extract(year from OrderDate)
having amt<20000
//JOOQ
context.select(ORDERS.CLIENT,year(ORDERS.ORDERDATE).as(“y”),sum(ORDERS.AMOUNT).as(“amt”),count(one()).as(“cnt”))
.from(ORDERS)
.groupBy(ORDERS.CLIENT,year(ORDERS.ORDERDATE))
.having(field(“amt”).lessThan(20000)).fetch();
//SPL
Orders.groups(Client,year(OrderDate):y;sum(Amount):amt,count(1):cnt)
.select(amt<20000)
为了模拟SQL,JOOQ使用了很多函数,规则很复杂,导致代码过长。SPL直接用面向对象的语法,规则简单,代码更短。
前面都是较简单计算,类似的计算还包括排序、去重、关联、集合交并差等计算,这里不再一一列举,总的来说,JOOQ进行简单计算时比SQL和SPL代码长,很多时候不易理解,开发效率较低。
**各组前3名**
//等价的SQL
select * from (select *, row_number() over (partition by Client order by Amount) rn from Orders) T where rn<=3
//JOOQ
WindowDefinition CA = name(“CA”).as(partitionBy(ORDERS.CLIENT).orderBy(ORDERS.AMOUNT));
context.select().from(select(ORDERS.ORDERID,ORDERS.CLIENT,ORDERS.SELLERID,ORDERS.AMOUNT,ORDERS.ORDERDATE,rowNumber().over(CA).as(“rn”)).from(ORDERS).window(CA) ).where(field(“rn”).lessOrEqual(3)).fetch();
//SPL
Orders.group(Client).(~.top(3;Amount)).conj()
这道题目稍有难度,JOOQ虽然模拟出了SQL,但使用了很多函数,代码长度远超SQL,语法也越来越不像SQL,编写理解更加困难。SPL先对客户分组,再求各组(即~)的前3名,最后合并各组计算结果,不仅代码更简短,且更易理解。
JOOQ使用了窗口函数,只适合特定版本的数据库,比如MySQL8,不能通用于其他版本的数据库,要想在MySQL5下实现同样的计算,代码改动非常麻烦。SPL有独立计算能力,代码可通用于任何数据库。
**某支股票最大连续上涨天数**
JOOQ:
WindowDefinition woDay1 = name(“woDay”).as(orderBy(APPL.DAY));
Table<?>T0=table(select(APPL.DAY.as("DAY"),when(APPL.PRICE.greaterThan(lag(APPL.PRICE).over(woDay1)),0).otherwise(1).as("risingflag")).from(APPL).window(woDay1)).as("T0"); WindowDefinition woDay2 = name("woDay1").as(orderBy(T0.field("DAY"))); Table<?>T1=table(select(sum(T0.field(“risingflag”).cast(java.math.BigDecimal.class)).over(woDay2).as(“norisingdays”)).from(T0).window(woDay2)).as(“T1”);
Table<?>T2=table(select(count(one()).as("continuousdays")).from(T1).groupBy(T1.field("norisingdays"))).as("T2"); Result<?> result=context.select(max(T2.field(“continuousdays”))).from(T2).fetch();
这个问题难度较高,需要综合运用多种简单计算。JOOQ很难直接表达连续上涨的概念,只能使用技巧变相实现,即通过累计不涨天数来计算连续上涨天数。具体是,先按时间顺序给每条记录打涨跌标记risingflag,如果下跌,则标为1,如果上涨,则标为0;再按时间顺序累计每条记录的不涨天数norisingdays,只有当前记录下跌时,这个数字才会变大,如果当前记录上涨,则这个数字不变;再按不涨天数norisingdays分组,求各组记录数,显然,连续下跌的一批记录的norisingdays不同,每条记录都会分到不同的组,该组计数为1,这个值不是解题目标,而连续上涨的一批记录的norisingdays相同,可以分到同一组,该组计数即连续上涨的天数,这个值是解题目标;最后用max函数求出最大的连续上涨天数。
JOOQ的编程过程是先写SQL,再翻译成JOOQ,对于简单计算来说,SQL比较好写,翻译也不会太难,但对于本题这种综合性计算来说,计算逻辑的技巧性比较强,SQL不好写,翻译的难度更大。此外,JOOQ表面上是方便调试的Java,但本质却是SQL,和SQL一样难以调试,这又为将来的维护工作埋下了大坑。
SPL代码简单多了:
APPL.sort(day).group@i(price<price[-1]).max(~.count())
这条SPL语句的计算逻辑和JOOQ是相同的,也是将连涨记录分到同一组中再求最大的组成员数,但表达起来要方便很多。group@i()表示遍历序表,如果符合条件则开始新的一组(并使之前的记录分到同一组),price<price[-1]这个条件表示股价下跌,则之前股价上涨的记录会分到同一组。[-1]表示上一条,是相对位置的表示方法,price[-1]表示上一个交易日的股价,比整体移行(lag.over)更直观。
相对位置属于有序计算,SPL是专业的结构化计算语言,支持有序计算,代码因此更简单。除了有序集合,SPL还可以简化多种复杂计算,包括多步骤计算、集合计算、复杂的关联计算。相反,这几类计算都是JOOQ不擅长的,通常要通过特殊技巧实现,代码很难写。
**SPL函数选项和层次参数**
值得一提的是,为了进一步提高开发效率,SPL还提供了独特的函数语法。有大量功能类似的函数时,JOOQ只能用不同的名字或者参数进行区分,使用不太方便。而SPL提供了非常独特的函数选项,使功能相似的函数可以共用一个函数名,只用函数选项区分差别。比如,select函数的基本功能是过滤,如果只过滤出符合条件的第1条记录,可使用选项@1:
T.select@1(Amount>1000)
对有序数据用二分法进行快速过滤,使用@b:
T.select@b(Amount>1000)
函数选项还可以组合搭配,比如:
Orders.select@1b(Amount>1000)
有些函数的参数很复杂,可能会分成多层。JOOQ对此并没有特别的语法方案,只能拆成多个函数互相嵌套,尽力模拟成SQL语法,导致代码冗长繁琐。而SPL创造性地发明了层次参数简化了复杂参数的表达,通过分号、逗号、冒号自高而低将参数分为三层。比如关联两个表:
join(Orders:o,SellerId ; Employees:e,EId)
### 流程处理
JOOQ支持部分存储过程语法,包括循环语句和判断语句,但这属于商业版功能,且权限要求高、安全隐患大,难以移植,一般很少用到。除了存储过程,JOOQ还可以利用Java实现流程处理,对数据库没有权限要求,安全隐患小,且可无缝移植。比如,根据规则计算奖金:
Orders.forEach(r->{
Double amount=r.getValue(ORDERS.AMOUNT);
if (amount>10000) {
r.setValue(ORDERS.BONUS), amount * 0.05);
}else if(amount>=5000 && amount<10000){
r.setValue(ORDERS.BONUS),amount*0.03);
}else if(amount>=2000 && amount<5000){
r.setValue(ORDERS.BONUS),amount*0.02);
}
});
forEach循环函数针对JOOQ的结构化数据对象进行了优化,可以通过Lambda表达式简化循环结构的定义,可以方便地处理集合对象的每个成员(代码中的循环变量r)。forEach函数配合Lambda语法,整体代码要比传统循环语句简单些。但也应该注意到,forEach函数里使用字段需要附带循环变量名,对单表计算来说是多余的,同样使用Lambda语法的SQL就可以省略变量名。此外,定义循环变量名也是多余的,SQL就不用定义。这些缺点都说明JOOQ在流程处理方面还不够专业,代码还有很大的优化空间。
SPL也有针对结构化数据对象进行优化的循环函数,直接用括号表示。同样根据规则计算奖金:
Orders.(Bonus=if(Amount>10000,Amount*0.05,
if(Amount>5000 && Amount<10000, Amount*0.03,
if(Amount>=2000 && Amount<5000, Amount*0.02)
)))
SPL的循环函数同样支持Lambda表达式,而且接口更简单,不必定义循环变量,使用字段时不必引用变量名,比JOOQ更方便,专业性也更强。除了循环函数,SPL还有更多专业的流程处理功能,比如:每轮循环取一批而不是一条记录;某字段值变化时循环一轮。
SPL专业的流程处理功能,配合专业的结构化数据对象和结构化数据计算能力,可大幅提高数据业务逻辑的开发效率。一个完整的例子:计算出奖金,并向数据库插入新记录。JOOQ需要生成多个文件,编写大段代码才能实现,SPL就简单多了:
| | | | |
| --- | --- | --- | --- |
| | A | B | C |
| 1 | =db=connect@e("dbName") | | /连接数据库,开启事务 |
| 2 | =db.query@1("select sum(Amount) from sales where sellerID=? and year(OrderDate)=? and month(OrderDate)=?", p\_SellerID,year(now()),month(now())) | | /查询当月销售额 |
| 3 | =if(A2>=10000 :200, A2<10000 && A2>=2000 :100, 0) | | /本月累计奖金 |
| 4 | =p\_Amount\*0.05 | | /本单固定奖金 |
| 5 | =BONUS=A3+A4 | | /总奖金 |
| 6 | =create(ORDERID,CLIENT,SELLERID,AMOUNT,BONUS,ORDERDATE) | | /创建订单的数据结构 |
| 7 | =A6.record([p\_OrderID,p\_Client,p\_SellerID,p\_Amount,BONUS,date(now())]) | | /生成一条订单记录 |
| 8 | >db.update@ik(A7,sales;ORDERID) | | /尝试写入库表 |
| 9 | =db.error() | | /入库结果 |
| 10 | if A9==0 | >A1.commit() | /成功,则提交事务 |
| 11 | else | >A1.rollback() | /失败,则回滚事务 |
| 12 | >db.close() | | /关闭数据库连接 |
| 13 | return A9 | | /返回入库结果 |
利用SPL的流程处理语句,可以实现存储过程的所有能力,包括游标的循环和判断。SPL不依赖数据库,不需要数据库权限,没有安全隐患,相当于库外的存储过程,同时,这些功能也都是开源的。
### 应用结构
**Java集成**
JOOQ本身就是Java,可被其他Java代码直接调用。
SPL是基于JVM的数据计算语言,提供了易用的JDBC接口,可被JAVA代码无缝集成。比如,将业务逻辑代码存为脚本文件,在JAVA中以存储过程的形式调用文件名:
Class.forName(“com.esproc.jdbc.InternalDriver”);
Connection connection =DriverManager.getConnection(“jdbc:esproc:local://”);
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
:local://");
[外链图片转存中…(img-OV5xffa9-1714966439902)]
[外链图片转存中…(img-OkipoaPU-1714966439902)]
[外链图片转存中…(img-NimrznIo-1714966439902)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新