Java 多线程写同一个文件实现

最近项目中需要从网站上抓取大量的数据,采用了多线程技术,每个线程抓取的数据都需要保存到一个文件中,避免消耗大量的内存。

思路:多个访问线程将需要写入到文件中的数据先保存到一个队列里面,然后由专门的 写出线程负责从队列中取出数据并写入到文件中。


WriterQueue.java 存放要输出的数据队列

package com.yulore.write;

import java.util.LinkedList;
import java.util.concurrent.locks.Condition;
import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReentrantLock;

public class WriterQueue {

	private static final int MAX_QUEUE_SIZE = 5000;
	private LinkedList<String> queue = new LinkedList<String>();
	private Lock lock = new ReentrantLock();
	private Condition notFull = lock.newCondition();
	private Condition notEmpty = lock.newCondition();
	
	private static WriterQueue manager = new WriterQueue();
	
	private WriterQueue(){
		
	}
	
	public static WriterQueue getQueue(){
		
		return manager;
	}
	
	public void put(String phone){
		
		lock.lock();
		
		try {
			while (queue.size() == MAX_QUEUE_SIZE) {
				System.out.println("warning: data queue is full!");
				notFull.await();
			}

			queue.addFirst(phone);
			
			notEmpty.signal();
		} catch (InterruptedException e) {
			e.printStackTrace();
		} finally{
			lock.unlock();
		}
	}
	
	public LinkedList<String> takeAll(){
		
		LinkedList<String> retVal = new LinkedList<String>();
		
		lock.lock();
		
		try {
			while (queue.size() == 0) {
				System.out.println("warning: data queue is empty!");
				notEmpty.await();
			}
			
			retVal.addAll(queue);
//			for(String str : queue){
//				retVal.add(str);
//			}
			//清空队列
			queue.clear();
			
			notFull.signal();
		} catch (InterruptedException e) {
			e.printStackTrace();
		} finally{
			lock.unlock();
		}
		return retVal;
	}
}

WriteTask_New.java 模拟产生数据的线程类

package com.yulore.write;

public class WriteTask_New implements Runnable {
	

	@Override
	public void run() {
		for(int i=0;i<20;i++){
//			try {
//				sleep(100);
//			} catch (InterruptedException e) {
//				e.printStackTrace();
//			}
			WriterQueue.getQueue().put("for:"+i+" thread:"+Thread.currentThread().getName());
		}
	}

	private void sleep(int millis) throws InterruptedException {
		Thread.sleep(millis);
	}
	
}

OutputTask.java 负责将数据写入到文件中

package com.yulore.write;

import java.io.BufferedWriter;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.util.LinkedList;

public class OutputTask implements Runnable {
	private String fileName;
	
	public OutputTask(String fileName) {
		this.fileName = fileName;
	}
	@Override
	public void run() {
		
		while(true){
			try {
				sleep(5000);
			} catch (InterruptedException e) {
				e.printStackTrace();
			}
			LinkedList<String> list = WriterQueue.getQueue().takeAll();
			write2Disk(list);
			list = null;
		}
	}

	private void write2Disk(LinkedList<String> list) {
		
		if(list==null ||list.size()==0){
			System.out.println("no data...");
			return;
		}
		
		System.out.println("开始序列化数据 "+fileName);
		
		String path = "D:/fbb/myWorkSpace_DW07/";
		File outputFile = new File(path+fileName);
		
		if(outputFile==null ||!outputFile.exists()){
			try {
				outputFile.createNewFile();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
		
		FileOutputStream out = null;
		OutputStreamWriter writer = null;
		BufferedWriter bw = null;
		
		try {
			out = new FileOutputStream(outputFile, true);
			writer = new OutputStreamWriter(out);
			bw = new BufferedWriter(writer);
			
			for(String content : list){
				bw.write(content);
				bw.newLine();
				bw.flush();
			}
			
		} catch (IOException e) {
			e.printStackTrace();
		}finally{
			try {
				if(bw!=null)
					bw.close();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
	}
	
	private void sleep(int millis) throws InterruptedException {
		Thread.sleep(millis);
	}

}

测试类

package com.yulore.write;

public class TestWrite {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		
//		test();
		test02();
	}

	private static void test02() {
		WriteTask_New write = new WriteTask_New();
		for(int i=0;i<4;i++){
			new Thread(write).start();
		}
		
		OutputTask output = new OutputTask("abc.txt");
		new Thread(output).start();
	}

	private static void test() {
		WriteTask write = new WriteTask("abc.txt");
		for(int i=0;i<5;i++){
			new Thread(write).start();
		}
	}
}






Java中,可以使用以下代码实现多线程读取同一个文件: ```java import java.io.BufferedReader; import java.io.FileReader; import java.io.IOException; public class MultiThreadFileReader implements Runnable { private final String filename; public MultiThreadFileReader(String filename) { this.filename = filename; } @Override public void run() { try (BufferedReader reader = new BufferedReader(new FileReader(filename))) { String line; while ((line = reader.readLine()) != null) { System.out.println(line); // 打印读取的文件内容 } } catch (IOException e) { e.printStackTrace(); } } public static void main(String[] args) { String filename = "input.txt"; // 创建多个线程并启动 Thread thread1 = new Thread(new MultiThreadFileReader(filename)); Thread thread2 = new Thread(new MultiThreadFileReader(filename)); Thread thread3 = new Thread(new MultiThreadFileReader(filename)); thread1.start(); thread2.start(); thread3.start(); // 等待所有线程执行完毕 try { thread1.join(); thread2.join(); thread3.join(); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println("All threads finished reading file."); } } ``` 上述代码中,`MultiThreadFileReader` 类实现了 `Runnable` 接口,用于定义线程的执行逻辑。在 `run()` 方法中,使用 `BufferedReader` 读取文件内容并打印出来。 在 `main()` 方法中,创建了多个线程并启动,每个线程都会调用 `MultiThreadFileReader` 类的构造方法,参数为要读取的文件名。然后使用 `start()` 方法启动线程。 最后,通过 `join()` 方法等待所有线程执行完毕,并输出提示信息。 需要注意的是,多个线程同时读取同一个文件并不会导致数据混乱或文件损坏的问题,因为读取操作是并发安全的。但是,考虑到文件的大小和读取速度,可能会出现文件内容的交错或乱序输出的情况。如果需要保证文件内容的顺序输出,可以在读取文件时进行适当的同步或排序处理。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值