广西民族大学高级人工智能课程—头歌实践教学实践平台—句法分析的常用方法与实战

1、第1关:Pyhanlp 的使用

代码文件

from pyhanlp import HanLP

text = input()

# 任务:使用pyhanlp对text进行关键词提取并输出前两个关键词
# ********** Begin *********#

# 使用 Pyhanlp 的 extractKeyword 方法提取前两个关键词
keywords = HanLP.extractKeyword(text, 2)

# 输出关键词列表
print(keywords)

# ********** End **********#

题目描述

任务描述

本关任务:根据本关所学有关 Pyhanlp 的知识,完成使用 Pyhanlp 进行关键词提取并通过所有测试用例。

相关知识

为了完成本关任务,你需要掌握:

  1. Pyhanlp 的基础知识;

  2. 学会使用 Pyhanlp。

Pyhanlp 简介

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

不同于一些简陋的分词类库,HanLP 精心优化了内部数据结构和 IO 接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120MB 。无论是移动设备还是大型集群,都能获得良好的体验。不同于市面上的商业工具, HanLP 提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。项目主页上提供了详细的文档,以及在一些开源语料上训练的模型。

HanLP 希望兼顾学术界的精准与工业界的效率,在两者之间取一个平衡,真正将自然语言处理普及到生产环境中去。

Pyhanlp 的使用

1、分词

pyhanlp 可以自定义多种分词规则和模型,也可以加入自定义词典,经测试,默认的分词方法效果就不错,而且兼备词性标注以及命名实体识别,可以识别人名、地名、机构名等信息。

示例1:分词

 
  1. texts = HanLP.segment(sentence) # 对文本进行分词
  2. for term in texts: # 输出分词结果
  3. print(term.word,term.nature)

2、关键词提取

在 pyhanlp 中,

  • 21
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值