java贝叶斯_贝叶斯文本分类 java实现

/**

* 训练器

*

* @author duyf

*

*/

class Train implements Serializable {

/**

*

*/

private static final long serialVersionUID = 1L;

public final static String SERIALIZABLE_PATH = "D:\\workspace\\Test\\SogouC.mini\\Sample\\Train.ser";

// 训练集的位置

private String trainPath = "D:\\workspace\\Test\\SogouC.mini\\Sample";

// 类别序号对应的实际名称

private Map classMap = new HashMap();

// 类别对应的txt文本数

private Map classP = new ConcurrentHashMap();

// 所有文本数

private AtomicInteger actCount = new AtomicInteger(0);

// 每个类别对应的词典和频数

private Map> classWordMap = new ConcurrentHashMap>();

// 分词器

private transient Participle participle;

private static Train trainInstance = new Train();

public static Train getInstance() {

trainInstance = new Train();

// 读取序列化在硬盘的本类对象

FileInputStream fis;

try {

File f = new File(SERIALIZABLE_PATH);

if (f.length() != 0) {

fis = new FileInputStream(SERIALIZABLE_PATH);

ObjectInputStream oos = new ObjectInputStream(fis);

trainInstance = (Train) oos.readObject();

trainInstance.participle = new IkParticiple();

} else {

trainInstance = new Train();

}

} catch (Exception e) {

e.printStackTrace();

}

return trainInstance;

}

private Train() {

this.participle = new IkParticiple();

}

public String readtxt(String path) {

BufferedReader br = null;

StringBuilder str = null;

try {

br =

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值