批量转换xml文件的编码格式(GB2312到UTF-8)

说实话不得不抱怨一下了,一堆xml文件让我解析,用python我弄了几个小时发现编码格式GB2312的转换为utf8的格式就是不行,我也不知道为什么。

于是我放弃用python的方法转换编码格式,采用java的编码格式转换,发现终于可以了

import java.io.File;

import java.io.FileOutputStream;
import java.io.IOException;
import org.dom4j.Document;
import org.dom4j.DocumentException;

import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
public class test {
	public static void main(String [] args) throws DocumentException, IOException{
		String base_path = "D:\\CEC2.3\\地震\\"; //文件夹的路径
		File file = new File(base_path); 
        for (File f : file.listFiles()) { //获取文件夹下的所有文件
            String[] str = f.getName().split("\\.");
            if(str[str.length-1].equals("xml")){
                SAXReader reader=new SAXReader();
        		String path = base_path+f.getName();//获取单个文件名+路径
        		Document doc=reader.read(new File(path));
        		OutputFormat format=new OutputFormat();
        		format.setEncoding("utf-8");
        		org.dom4j.io.XMLWriter writer=new XMLWriter(new FileOutputStream(path),format);
        		writer.write(doc);
        		writer.close();
            }
        }
	}
	
}

用的是maven:

依赖:

 <dependency>
          <groupId>dom4j</groupId>
          <artifactId>dom4j</artifactId>
          <version>1.6.1</version>
</dependency>

再去文件夹中看文件,发现变成utf-8的编码格式了。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值