import joinery.DataFrame
df = new DataFrame()
df = df.readXls("S地方.xls").sortBy('START_TIME') //导入EXECL 只能是xls的,xlsx的目前不支持
df.convert() //格式化一下 修改各个字段的类型
println(df)
println(df.types())
println("====================")
nums = df.groupBy("A号码").count() //按字段聚合
df1 = nums.col("A号码") //选择某个字段新建一个
println(df1)
println("====================")
for (num in df1) {
println("***********")
lists = df.select(new DataFrame.Predicate<Object>() {//按照某个字段选择出相关的数据
Boolean apply(List<Object> values) {
return values.get(1) == num //进行字段比较 字段只能用编码的index
}
})
println(lists)
lists.writeXls(num + '.xls') //导出EXECL
}
比起python pandas 还有差距 简单凑合用还是可以的 做个记录
但是 不支持2007以后的XLSX是 这个库的问题,后续版本可能会解决吧