数据处理经验总结·大数据文件处理参考值

打印在控制台的字符串类型如果两边带有引号的话,说明字符串存储的时候就有引号。

 

经验:在对大测试数据进行转化前,先自己编写样例数据文件,确保样例数据文件对所有测试对象(数据库)能跑通,本质上是确保1、原始数据能够转换出我们要的各种数据;2、转换出的各种数据能够适用各种对象,关键是1,然后再编程对大测试数据进行统一转化。

三元组语义网数据处理时间和资源估算

4g文本文件,Java按行读写进行简单处理大约需要2.5天。

4g文本文件,56GB系统内存,20GB堆内存。 全部先读入List<String[]>,一行对应一个String[],读入阶段CPU使用100%,然后所有List<String[]>里的内容进行简单处理后拼接进入一个StringBuilder(). 在整个过程的某个阶段,会OutOfMemory.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值