分词工具实验(代码示例)

1. 哈工大语言云(python)
功能和形式都很多样化,准确率也很高,但依赖网络,识别速度慢。庆幸的是还有哈工大分词有本地版本,效果相同,但是没有语言云的格式多样。以下是语言云版本。

# -*- coding: utf-8 -*-

"""
功能:哈工大语言云使用测试
时间:2017年11月14日
"""

import urllib2

url_get_base = "http://api.ltp-cloud.com/analysis/?"
api_key = '# 输入注册API_KEY'

# 待分析的文本
text = "这是一个测试文本"

format0 = 'json'                                       # 结果格式,有xml、json、conll、plain(不可改成大写)
pattern = 'dp'                                        # 指定分析模式,有ws、pos、ner、dp、sdp、srl和all

result = urllib2.urlopen("%sapi_key=%s&text=%s&format=%s&pattern=%s"
                         % (url_get_base, api_key, text, format0, pattern))
content = result.read().strip()
print content

2. python自带工具包pynlpir
简单方便, 在计算所的ictclas基础上开发,分词准确率高

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import pynlpir

pynlpir.open()

s = '我家在贵州'
m = pynlpir.segment(s,pos_names='child')

for word in m:
    print word[0]
    print word[1]

pynlpir.close()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值