java通过搜狗词库过滤指定词性_使用Java将搜狗词库文件(文件后缀为.scel)转为.txt文件...

该博客介绍了如何使用Java实现搜狗词库(.scel)到TXT的转换。通过读取.scel文件,解析词库内容,并将其写入目标TXT文件,支持单个文件和多个文件夹的处理。
摘要由CSDN通过智能技术生成

packagecn.ucmed.impl;importlombok.extern.slf4j.Slf4j;import java.io.*;import java.util.*;

@Slf4jpublic class SougouScelFileProcessing extendsFileProcessing {protected static String encoding = "UTF-16LE";protected ByteArrayOutputStream output = newByteArrayOutputStream();/*** 解析单个或者多个文件,如果是多个文件则生成对应的txt文件,{@link#setTargetDir(String)},

* 如果targetDir不设置,则在当前文件夹下生成相应的txt文件

*

*@paramfilePath 源文件路径

*@paramisAppend false:覆盖内容 true:附加内容*/@Overridepublic void parseFile(String filePath, booleanisAppend) {

File file= newFile(filePath);if(file.isDirectory()) {

File items[]=file.listFiles();for (int i = 0; i < items.length; i++) {if (!items[i].getName().endsWith(".scel")) {continue;

}if (targetDir == null) {

parseFile(items[i].getAbsolutePath(), items[i].getAbsolutePath().replace(".scel", ".txt"),

isAppend);

}else{

parseFile(items[i].getAbsolutePath(), targetDir+ "/" + items[i].getName().replace(".scel", ".txt"),

isAppend);

}

}

}else{

parseFile(filePath, file.getAbsolutePath().replace(".scel", ".txt"), isAppend);

}

}/*** 解析单个scel文件

*

*@paramfilePath 源文件路径

*@paramtargetFilePath

*@paramisAppend false:覆盖内容 true:附加内容*/@Overridepublic void parseFile(String filePath, String targetFilePath, booleanisAppend) {if (!targetFilePath.endsWith(".txt")) {throw new IllegalStateException("文件格式错误,后缀必须为.txt,此格式为 " +targetFilePath);

}if (!filePath.end

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值