去除 csv 文件中的重复行

【问题】

I have a csv file. columns in csv file - "SNo. StateName CityName AreaName PinCode NonServ.Area MessangerService Remark". The column CityName has repeated values.

Ex: In many records, it has unique value (Delhi). Is there any approach in java to read that csv file and get the distinct values from that column of the csv file.

【回答】

去除重复行是简单的结构化计算,但JAVA缺乏相关的类库,实现过程复杂,代码可读性差。这种情况下可以用SPL辅助实现,代码更直观易懂:

A
1=file("E:\\yourfile.csv").import@tc()
2=A1.group@1(CityName)

A1: @c表示以逗号为分隔符读入文件。@t表示将第一行读为列名。

A2:按CityName分组,取各组第1条记录。该问题的规则没写清楚,这里假设是:如果多条记录里的CityName重复,则保留第1条记录。

关于JAVA集成,参考Java 如何调用 SPL 脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值