结合h2的csvread辅助文本统计分析

最近一直做一些数据分析

如:

在一些第三方工具上导出一些csv/xls格式的文件,然后分析里面的内容,做过滤合并或统计等,用groovy习惯了,所以处理些文本还是小菜的,就是要做统计的时候,不用sql真麻烦啊,本来一个group by的,自己用代码写就很蹩脚,如

 

list.clone().unique{it.id}.each{

  int num = list.count{one -> it.id == one.id}
  ***
}

 

 

groovy的db组件很8错的,弄一个内存数据库,可以很容易实现文本和sql结合做数据,就没必要每次都整理文件导入数据库了,而且sql提供的string方法就灵活性而言不如动态语言

 

代码原语如下

import groovy.sql.Sql

def p = [
  url:'jdbc:h2:mem:test', 
  u:'sa', 
  p:'', 
  driver:'org.h2.Driver'
]
def db = Sql.newInstance(p.url, p.u, p.p, p.driver)

try {
	db.execute('''
	create table temp ();
	'''
	)
	String sql = '''
		select a.flag, a.dat, count(1) as num from csvread('test.csv') a 
			group by dat, flag
	'''
	db.rows(sql).each{
		println it.DAT.padRight(20) + it.FLAG.padRight(10) + it.NUM
	}
}finally {
    db.close()
}

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值