java weka instance_java开源数据挖掘工具weka例子代码分享

一人谈视频

于 2021-02-24 20:14:01 发布

阅读量281

点赞数

文章标签： java weka instance

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36284522/article/details/114584401

版权

这个Java程序展示了如何使用Weka库中的J48决策树对文本信息进行分类。通过创建一个实例，应用StringToWordVector过滤器，然后训练和分类消息。程序还涉及IKAnalyzer对中文文本的分词处理。

摘要由CSDN通过智能技术生成

package IKAnalyzer;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.FileReader;

import java.io.ObjectInputStream;

import java.io.ObjectOutputStream;

import java.io.Reader;

import java.io.Serializable;

import java.io.StringReader;

import java.util.ArrayList;

import java.util.List;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.TokenStream;

import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;

import org.wltea.analyzer.lucene.IKAnalyzer;

import weka.classifiers.Classifier;

import weka.classifiers.trees.J48;

import weka.core.Attribute;

import weka.core.DenseInstance;

import weka.core.Instance;

import weka.core.Instances;

import weka.core.Utils;

import weka.filters.Filter;

import weka.filters.unsupervised.attribute.StringToWordVector;

//将简单的文本信息分为两个类别的Java程序

//MessageClassifier -m data/textToTrain/Education003.txt -c miss -t data/messageclassifier.model

//改变txt和相应的hit/miss，训练(education01/02/03 miss,history01/02/03 hit)

//MessageClassifier -m data/textToTest/Education000.txt -t data/messageclassifier.model,再进行分类

public class MessageClassifier implements Serializable {

privat

最低0.47元/天解锁文章

一人谈视频

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。