这是老师大作业需要的技术才知道hanlp这个外部包 使用方法
包以及数据如下GIT下载很慢我传百度云了 链接:https://pan.baidu.com/s/14a22v1g_CAQN-G-k8f3Ovw 提取码:yfse
1 把你的下载的data解压到你项目的根目录下 例如你项目文件夹叫 test 把data文件夹放在text文件夹下就行
2 配置 hanlp.properties 把这个文件放在你需要调用hanlp的目录下(那个文件调用了这外部包方法就放在跟这个文件同级的目录下) 配置里面的root 目录为你项目目录可以是绝对路径也可以是相对 例如 我的项目叫 ITcihuifenxi 我配置root 为 root=D:/hadoop-web/ITcihuifenxi/
3 上代码
package com.test; import java.util.List; import com.hankcs.hanlp.HanLP; import com.hankcs.hanlp.seg.common.Term; import com.hankcs.hanlp.suggest.Suggester; import com.hankcs.hanlp.tokenizer.NLPTokenizer; public class MainTest { public static void main(String[] args) { System.out.println("首次编译运行时,HanLP会自动构建词典缓存,请稍候……\n"); //第一次运行会有文件找不到的错误但不影响运行,缓存完成后就不会再有了 System.out.println("标准分词:"); System.out.println(HanLP.segment("你好,欢迎使用HanLP!")); System.out.println("\n"); List<Term> termList = NLPTokenizer.segment("中国科学院计算技术研究所的宗成庆教授正在教授自然语言处理课程"); System.out.