针对文本过滤分组等多项计算

【问题】

Really struggling to work this out…

I have a text file with data like this (17000 lines of it)

45226 1
45226 1 
45226 1 
45226 3 
45226 5 
23470 1 
45226 5 
45226 5 
29610 4 
37417 2 
37417 3 
37948 1 

What I want to do is sort the text file (using java) so all the left numbers are grouped if the right value is 1. or the left value is group if the right is not equal to 1 (so any other number). for example (but doesn’t have to be like this)

3 x 45226 1
4 x 45226 MIXED
1 x 23470 1
1 x 29610 MIXED
2 x 37417 MIXED
1 x 37948 1

I know I may need to use array? or some sort of sort? but I just can’t work it out :’(

Any help, code or suggestions - greatly appreciated!

Thank you!

【回答】

解决这个问题只需要简单的结构化算法就可以,思路是:分别查询出第二列等于 1 的记录和不等于 1 的记录;对这两部分数据分别按照第一列分组,并求得每组记录的行数;在这两部分数据分别加入新列,第一部分加一列“1”,第二部分加一列“MIXED”;最后将两部分数据合并。

算法虽简单,但 JAVA 缺乏现成的函数,你必须手工书写查询、分组、加列、合并等函数,实现起来麻烦不小。用 SPL 可以很容易实现对应的算法:

AB
1=file("E:/lines.txt").import()
2=A1.select(_2==1)=A1.select(_2!=1)
3=A2.groups(_1;count(_1):value)=B2.groups(_1;count(_1):value)
4=A3.new(concat(value)+"x"+concat(_1):value,"1":tag)=B3.new(concat(value)+"x"+concat(_1):value,"MIXED":tag)
5=A4|B4

集算器是结构化数据计算工具,可以通过 JDBC 被 JAVA 集成,更多资料请参考【Java 如何调用 SPL 脚本】【集算器协助 java 处理结构化文本

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值