java分词技术（自动提取关键词，段落大意）hanlp

最新推荐文章于 2021-10-29 14:24:26 发布

weixin_30488313

最新推荐文章于 2021-10-29 14:24:26 发布

阅读量1.5k

点赞数

文章标签： java 人工智能 matlab

原文链接：http://www.cnblogs.com/xuexidememeda/p/10346472.html

版权

这是老师大作业需要的技术才知道hanlp这个外部包使用方法

包以及数据如下GIT下载很慢我传百度云了链接：https://pan.baidu.com/s/14a22v1g_CAQN-G-k8f3Ovw 提取码：yfse

1 把你的下载的data解压到你项目的根目录下例如你项目文件夹叫 test 把data文件夹放在text文件夹下就行

2 配置 hanlp.properties 把这个文件放在你需要调用hanlp的目录下（那个文件调用了这外部包方法就放在跟这个文件同级的目录下）配置里面的root 目录为你项目目录可以是绝对路径也可以是相对例如我的项目叫 ITcihuifenxi 我配置root 为 root=D:/hadoop-web/ITcihuifenxi/

3 上代码

package com.test;
import java.util.List;

import com.hankcs.hanlp.HanLP;
import com.hankcs.hanlp.seg.common.Term;
import com.hankcs.hanlp.suggest.Suggester;
import com.hankcs.hanlp.tokenizer.NLPTokenizer;

public class MainTest {
    public static void main(String[] args) {
        System.out.println("首次编译运行时，HanLP会自动构建词典缓存，请稍候……\n");
        //第一次运行会有文件找不到的错误但不影响运行，缓存完成后就不会再有了
        System.out.println("标准分词：");
        System.out.println(HanLP.segment("你好，欢迎使用HanLP！"));
        System.out.println("\n");

        List<Term> termList = NLPTokenizer.segment("中国科学院计算技术研究所的宗成庆教授正在教授自然语言处理课程");
        System.out.

最低0.47元/天解锁文章

weixin_30488313

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
java分词技术（自动提取关键词，段落大意）hanlp

这是老师大作业需要的技术才知道hanlp这个外部包使用方法包以及数据如下GIT下载很慢我传百度云了链接：https://pan.baidu.com/s/14a22v1g_CAQN-G-k8f3Ovw提取码：yfse1 把你的下载的data解压到你项目的根目录下例如你项目文件夹叫test 把data文件夹放在text文件夹下就行2配置hanlp.properti...
复制链接

扫一扫