这几天在做一个数据规范化的东东,数据量比较大。一开始以为只要将功能实现即可,但后来发现当数据量较大时,程序运行速度相当的慢,一个1兆的文本在一个512的机子上处理得30分钟才能计算完毕。这种性能很显然是极差的。以前做程序,我都很少考虑性能问题,也许主要是因为很少涉及到大规模运算的缘故吧。看来以后做程序必须充分考虑程序的性能了。
1 String,StringBuffer,StringBuilder
在处理大量字符串时,采用String类的性能极差,而采用后二者则性能较好。一般建议不要用String。
2 StringTokenizer
这是处理和分析文本时经常用到的一个类,其要求所处理的对象是字符串,因此在处理文本时需要将内容转换未字符串后才能较好的运用该类。
3 csv
是一种独特的文件格式,可以通过excel直接导出这种格式的文件。
结论:
编程要专业
代码要规范
性能要最优