java分割txt全量文件

public class Ja {
public static void main (String args[])throws IOException{
File files=new File("D:/all_2012-03-28.txt");
FileReader readfile=new FileReader(files);
BufferedReader buffer=new BufferedReader(readfile);
String s;
System.out.println(DateUtil.getStandardTime());
int i=0;
int m=0;//全量文件行数
int ge=0;//新生成文件个数
StringBuffer fileContent = new StringBuffer();
while((s=buffer.readLine())!=null){

File file=null;
// for( int i=0;i<tlist.size();i++){
if(ge==0){
file = new File("D://logs//all_2012-03-28_"+ge+".txt"); //生成第一个分段全量新文件
if(!file.getParentFile().exists()){
file.mkdir();
}
ge++;
}
fileContent.append(s.toString());
fileContent.append(System.getProperty("line.separator")); //System.getProperty("line.separator")获取行分隔符(如“/n”)
write(fileContent.toString(), "D://logs//all_2012-03-28_"+(ge-1)+".txt","UTF-8");//写入分段全量新文件
if(m==20000){
m=0;
file = new File("D://logs//gall_2012-03-28_"+ge+".txt"); //生成分段全量新文件

if(!file.getParentFile().exists()){
file.mkdir();
}
ge++;
fileContent=null;
fileContent= new StringBuffer();
}
m++;




}
System.out.println("ok"+i);

System.out.println(DateUtil.getStandardTime());
}
/**
* 以utf-8格式写文件
* @param fileContent
* @param fileName
* @param encoding
*/

public static void write(String fileContent, String fileName, String encoding) {
try {
FileOutputStream fos = new FileOutputStream(fileName);
OutputStreamWriter osw = new OutputStreamWriter(fos, encoding);
osw.write(fileContent);
osw.flush();
} catch (Exception e) {
e.printStackTrace();
}
}
}
public class IdiomProcessor { public static void main(String[] args) { // 定义输入文件路径和输出文件路径 String inputFile ="D:\yy\java\成语接龙\成语大全\去重后.txt"; String outputFile = "D:\yy\java\成语接龙\成语大全\全量成语处理后.txt"; try (BufferedReader reader = new BufferedReader(new FileReader(inputFile)); BufferedWriter writer = new BufferedWriter(new FileWriter(outputFile))) { // 定义成语列表和成语末尾字与开头字相同的数量Map List<String> idiomList = new ArrayList<>(); Map<Character, Integer> countMap = new HashMap<>(); // 读取每一行成语信息 String line; while ((line = reader.readLine())!= null) { if (line.trim().isEmpty()) { continue; // 跳过空行 } if (line.contains("拼音:")) { // 处理包含指定内容的行 System.out.println("我动了"); // 将成语与其他信息分割 String[] parts = line.split("拼音:"); // 将成语加入成语列表 String idiom = parts[0]; idiomList.add(idiom); // 计算成语末尾字与开头字相同的数量 char lastChar = idiom.charAt(idiom.length() - 1); countMap.put(lastChar, countMap.getOrDefault(lastChar, 0) + 1); // 将原来的信息每一条加上count后输出到另一个文件 String newLine = line + "可接:" + countMap.get(lastChar) + "\n"; writer.write(newLine); } } } catch (IOException e) { e.printStackTrace(); } } }由于代码在用Map统计lastChar时不同成语的末尾字会相同,所以用Map记录时,输出的count有错,如何改正
06-08
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值