最简单的介绍如何使用mmseg进行自然语言处理

本文介绍了如何使用mmseg进行自然语言处理,包括安装、词典生成、文本解析等步骤,并给出了根据不同领域调整词典以提高效果的示例。
摘要由CSDN通过智能技术生成

官网:

http://www.coreseek.cn/news/14/54/

http://www.coreseek.cn/products-install/

使用说明:http://www.coreseek.cn/opensource/mmseg/


一共有4个文件:

basedict.txt

mmseg.ini

mmseg

test.txt


basedict.txt里边是:

数据 1
x:1
程序 1
x:1


test.txt里边是:

程序不知道怎么进行设计


然后mmseg是二进制文件


使用步骤:

1、生成词典词库

./mmseg -u basedict.txt

此时生成basedict.txt.uni,修改名字为uni.lib

2、用生成的词典词库进行自然语言的解析

 ./mmseg -d ./ test.txt

结果:程序/x 不/x 知/x 道/x 怎/x 么/x 进/x 行/x 设/x 计/x


有人说了,这个不是想要的,我们期待的结果是:

程序 不知道 怎么 进行 设计


此时就需要增加词典识别的内容,毕竟不同领域的数据不一样,还是需要自己添加才更方便&#x

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值