零:前言
记录一篇关于hanlp中几个分词工具的用法
一、hanlp是什么?
强大的自然语言处理包(python中又叫pyhanlp)
二、安装
直接 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 库名
想要安装更快更持久吗,点我
三、上代码
代码为引用加修改,链接在文末
#-*- coding:utf-8 -*-
from jpype import *
from pyhanlp import * #原文这里用命令行启用hanlp,
#本文推荐直接安装pyhanlp库
print("=" * 30 + "HanLP分词" + "=" * 30)
HanLP = JClass('com.hankcs.hanlp.HanLP')
# 中文分词
print(HanLP.segment('你好,欢迎在Python中调用HanLP的API'))
print("-" * 70)
print("=" * 30 + "标准分词" + "=" * 30)
StandardTokenizer = JClass('com.hankcs.hanlp.tokenizer.StandardTokenizer'