工作中遇到要将大文本(500M以上)文件切割成小文本文件,再利用多线程来提高上传效率的问题。如果直接用readLine,则效率很差。改进的方式是先按照大小来进行切分,再寻找换行符,以保证每行记录的完整性。
下面是代码部分:
import java.io.EOFException;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.io.RandomAccessFile;
public class Split {
static final int byteSize = 10 * 1024 *