pyhanlp 工具类HanLP基本使用

工具类HanLP调用常用接口

分词

可以用两种方法输出:

from pyhanlp import *
content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.segment(content)
for term in words:
    print(term.word, term.nature)
print(words)

在这里插入图片描述

在这里插入图片描述

依存句法分析

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.parseDependency(content)
print(words)

在这里插入图片描述

关键词提取

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.extractKeyword(content, 10)
print(words)

在这里插入图片描述

摘要提取

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"

words = HanLP.extractSummary(content, 1)#提取短语,同时指定摘要的最大长度 
print(words)

在这里插入图片描述

感知机词法分析器

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
PerceptronLexicalAnalyzer = JClass('com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer')
analyzer = PerceptronLexicalAnalyzer()
words = analyzer.analyze(content)
print(words)

在这里插入图片描述

中国人名识别

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
NER = HanLP.newSegment().enableNameRecognize(True)
words = NER.seg(content)
print(words)

在这里插入图片描述

音译名识别

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,珍妮还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
NER = HanLP.newSegment().enableTranslatedNameRecognize(True)
words = NER.seg(content)
print(words)

在这里插入图片描述

短语提取

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,珍妮还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.extractPhrase(content, 3)
print(words)

在这里插入图片描述

简繁转换

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
Traditional_content = "雖然原始的食材便具有食物原始的風情,雲初還是認爲," \
                      "最美味的食物還是需要經過分割,烹調,處置,最後端上桌的食物纔是最符合大唐人腸胃的食物。"
print(HanLP.convertToTraditionalChinese(content))
print(HanLP.convertToSimplifiedChinese(Traditional_content))

在这里插入图片描述

拼音转换

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
print(HanLP.convertToPinyinList(content))

在这里插入图片描述

声母、韵母

from pyhanlp import *

content = "虽然原始的食材便具有食物原始的风情,云初还是认为," \
          "最美味的食物还是需要经过分割,烹调,处置,最后端上桌的食物才是最符合大唐人肠胃的食物。"
words = HanLP.convertToPinyinList(content)
for i in words:
    print(i.getShengmu(), i.getYunmu())

在这里插入图片描述

pyhanlp可视化

使用命令hanlp serve
在这里插入图片描述
在这里插入图片描述

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

<编程路上>

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值