python-LAC使用方法的相关总结

4 篇文章 0 订阅
1 篇文章 0 订阅

代码如下:

from LAC import LAC

# 分词的功能
def fenci():
    # 装载分词模型
    lac = LAC(mode='seg')

    # 单个样本输入,输入为Unicode编码的字符串
    text = u"LAC是个优秀的分词工具"
    seg_result = lac.run(text)
    print(seg_result)

    # 批量样本输入, 输入为多个句子组成的list,平均速率会更快
    texts = [u"LAC是个优秀的分词工具", u"百度是一家高科技公司"]
    seg_result = lac.run(texts)
    print(seg_result)

# 词性标注以及实体的识别
def cixingbiaozhuheshitishibie():

    # 装载LAC模型
    lac = LAC(mode='lac')

    # 单个样本输入,输入为Unicode编码的字符串
    text = u"LAC是个优秀的分词工具"
    lac_result = lac.run(text)

    # 批量样本输入, 输入为多个句子组成的list,平均速率更快
    texts = [u"LAC是个优秀的分词工具", u"百度是一家高科技公司"]
    lac_result = lac.run(texts)
    print(lac_result)
    # 标签	含义	标签	含义	标签	含义	标签	含义
    # n	普通名词	f	方位名词	s	处所名词	nw	作品名
    # nz	其他专名	v	普通动词	vd	动副词	vn	名动词
    # a	形容词	ad	副形词	an	名形词	d	副词
    # m	数量词	q	量词	r	代词	p	介词
    # c	连词	u	助词	xc	其他虚词	w	标点符号
    # PER	人名	LOC	地名	ORG	机构名	TIME	时间

# 表现词语重要性
def ciyuzhongyaoxing():
    # 装载词语重要性模型
    lac = LAC(mode='rank')

    # 单个样本输入,输入为Unicode编码的字符串
    text = u"LAC是个优秀的分词工具"
    rank_result = lac.run(text)

    # 批量样本输入, 输入为多个句子组成的list,平均速率会更快
    texts = [u"LAC是个优秀的分词工具", u"百度是一家高科技公司"]
    rank_result = lac.run(texts)
    print(rank_result)

# 定制化功能
def dingzhihua():
    lac = LAC()

    # 装载干预词典, sep参数表示词典文件采用的分隔符,为None时默认使用空格或制表符'\t'
    lac.load_customization('custom.txt', sep=None)

    # 干预后结果
    custom_result = lac.run(u"春天的花开秋天的风以及冬天的落阳")
    print(custom_result)



if __name__ == '__main__':
    # 测试分词的操作
    # fenci()
    # 进行此行的标注以及实体的识别
    # cixingbiaozhuheshitishibie()
    # 表现词语重要性的
    # ciyuzhongyaoxing()
    # 定制化功能
    # dingzhihua()
    

参考文档如下:

https://github.com/baidu/lac/blob/master/python/README.md

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

喜欢地上爬的孩子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值