源码下载:http://download.csdn.net/detail/lujian863/3910687
因为一开始没考虑到tfx词频加权公式需要的参数,导致后来很多函数又写了一遍··· 所以本来300行代码就可以搞定的,最后写了超过六百行,写好后准备重写的,后来想想还是算了,省点时间复习吧。由于初学Java,界面这一块很蛋疼,一开始用的是swt绘出的界面,后来打开文件窗口不会用swt,于是抄了个swing的,所以有点不伦不类,好在主要看分词算法。
关于源码的一些说明:
界面采用swt designer绘出,打开数据源窗口用swing绘出;
项目文件导入时须添加一些包文件,在项目根目录的lib文件夹下;
算法(wordSub.java)由于是本人第一次所写,很多函数功能上重复了,所以可以大幅度优化;
算法有一些小bug,由于要考试了,就不再修改了,基本功能可以实现;
lujian863 2011年12月6日
昨天写完后发现忘了上传运行效果图了,现在传一下~