由于需要处理大量的文本文件,并对文件中的内容进行逐行字符串分割。涉及到split()和StringTokenizer两种方法,所以对二者的性能进行了一下比较。
选取了一个1.58M大小的CSV文件,其中有4420行的数据,做的处理是分别用两种方法读取文件,并逐行进行分割,然后再将每行的内容输出。分别测试两种方法的耗时。
选取了一个1.58M大小的CSV文件,其中有4420行的数据,做的处理是分别用两种方法读取文件,并逐行进行分割,然后再将每行的内容输出。分别测试两种方法的耗时。
对每种方法都执行了五遍,取其耗时的平均值进行比较,共做了两次比较,第一次split()方法比StringTokenizer方法多耗时66.4ms;而第二次多耗时148ms。说明后者的性能要优于前者,这与网上其它分析二者性能的文章的结果也相一致。
while ((line = reader.readLine()) != null)
{
StringTokenizer st = new StringTokenizer(line, ",");
while (st.hasMoreTokens())
{
System.out.print(st.nextToken() + " ");
}
System.out.println();
}
while ((line = reader.readLine()) != null)
{
String[] line_data=line.split(",");
for (int i=0;i
{
System.out.print(line_data[i] + " ");
}
System.out.println();
}