在java中怎么使用weka_java怎么用weka

Java读XML有两种 方式SAX和DOM,用SAX做流式处理读一条就输出一条,不要一次性全部load到内存再处理,不会有问题的。你用着两个当关键字搜索便知 ######

引用来自“逝水fox”的答案

Java读XML有两种 方式SAX和DOM,用SAX做流式处理读一条就输出一条,不要一次性全部load到内存再处理,不会有问题的。你用着两个当关键字搜索便知

非常感谢你的回答,我想再问一下,如果用SAX来读的话,因为有100多万条记录,一条一条读速度会不会很慢?另外,如果是DOM的话,能不能一条一条的读啊?谢谢

######

才处理1G 的文件,没多大。这种情况用 SAX 没问题,用 DOM 就要看机器内存够不够大了。 ######建议用sax,java读取xml的库很多,直接用就行。第二个方案是直接解析xml文件,根据文件本身的特点进行字符串分析和处理。csv本身也是一种本地数据库格式,支持sql操作,你可以用第三方库进行操作,比如ado或支持csv的odbc驱动。######请问数据格式该怎么组织呢?对于DBLP数据集,我只要每条记录的作者,别的信息都不需要。但是很多记录有是多个作者合著,把它该写成什么格式才能让weka识别这是一条记录里的多个项啊?也就是说,怎么在csv文件里组织合著作者信息呢?######

引用来自“jorneyr”的答案

才处理1G 的文件,没多大。这种情况用 SAX 没问题,用 DOM 就要看机器内存够不够大了。

麻烦问下,如果是用SAX的话,直接写个java的解析小程序是不是就可以了?这样的小程序是否能处理这个数据集呢?

######

引用来自“gwgyk”的答案

引用来自“jorneyr”的答案

才处理1G 的文件,没多大。这种情况用 SAX 没问题,用 DOM 就要看机器内存够不够大了。

麻烦问下,如果是用SAX的话,直接写个java的解析小程序是不是就可以了?这样的小程序是否能处理这个数据集呢?

没问题

######你好,请问你重新编译过weka吗?######

引用来自“diemeng1119”的答案

你好,请问你重新编译过weka吗?

没有,才开始学着使用weka

######

spring batch######

引用来自“Jeff_Lau_NUAA”的答案

spring batch

直接写个java小程序可以么?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值