【实例简介】
java版结巴分词工具,一个很好的中文分词工具。直接用eclipse打开,输入是一篇文章,然后输出是每个词的词频,并且词频是按照大小从次数最高到次数最低排的,只需要在test包里改部分代码就可以使用了。
不下你会后悔的。
【实例截图】
【核心代码】
JBFC
└── JBFC
├── bin
│ ├── com
│ │ └── huaban
│ │ ├── analysis
│ │ │ └── jieba
│ │ │ ├── CharacterUtil.class
│ │ │ ├── DictSegment.class
│ │ │ ├── Hit.class
│ │ │ ├── JiebaSegmenter$SegMode.class
│ │ │ ├── JiebaSegmenter.class
│ │ │ ├── Node.class
│ │ │ ├── Pair.class
│ │ │ ├── SegToken.class
│ │ │ ├── viterbi
│ │ │ │ └── FinalSeg.class
│ │ │ └── WordDictionary.class
│ │ └── ananlysis
│ │ └── utils
│ │ └── ReadTxt.class
│ ├── dict.txt
│ ├── jieba.java.code.style.xml
│ ├── prob_emit.txt
│ └── test
│ ├── Test$1.class
│ └── Test.class
└── src
├── com
│ └── huaban
│ ├── analysis
│ │ └── jieba
│ │ ├── CharacterUtil.java
│ │ ├── DictSegment.java
│ │ ├── Hit.java
│ │ ├── JiebaSegmenter.java
│ │ ├── Node.java
│ │ ├── Pair.java
│ │ ├── SegToken.java
│ │ ├── viterbi
│ │ │ └── FinalSeg.java
│ │ └── WordDictionary.java
│ └── ananlysis
│ └── utils
│ └── ReadTxt.java
├── dict.txt
├── jieba.java.code.style.xml
├── prob_emit.txt
└── test
└── Test.java
19 directories, 30 files