python中中文分词模块_【记录】折腾Python中的mmseg中文分词模块

最新推荐文章于 2024-05-04 23:13:48 发布

weixin_39593744

最新推荐文章于 2024-05-04 23:13:48 发布

阅读量206

点赞数

文章标签： python中中文分词模块

从这里知道mmseg的，然后就去折腾试试。

1.找到了主页：

然后先去看最新的1.3.0版本的：

mmseg简介

用来将一段文字，分成对应的(多个)词语。

比如，将：张无忌在光明顶

分为：无忌

张无忌

光明

光明顶

下载mmseg

点击下载：

得到mmseg-1.3.0.tar.gz。

安装mmseg

解压mmseg-1.3.0.tar.gz得到文件夹mmseg-1.3.0

打开cmd，切换到目录mmseg-1.3.0

运行setup.py去安装，结果出现

error: Unable to find vcvarsall.bat

的错误，详细折腾过程参见：

但是却又出现其他错误：

使用mmseg#!/usr/bin/python

# -*- coding: utf-8 -*-

"""

Function:

【记录】折腾Python中的mmseg中文分词模块

https://www.crifan.com/try_python_mmseg_chinese_segment_on_mmseg_algorithm

Author: Crifan Li

Version: 2013-01-02

Contact: admin at crifan dot com

"""

from mmseg import seg_txt;

def tryMmseg():

for i in seg_txt("最主要的更动是：张无忌最后没有选定自己的配偶。"):

print i;

if __name__ == "__main__":

tryMmseg();

但是由于之前链接出错：

导致使用代码时出错：

暂未解决。

总结

mmseg，还是很折腾的。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39593744

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中中文分词模块_【记录】折腾Python中的mmseg中文分词模块

从这里知道mmseg的，然后就去折腾试试。1.找到了主页：然后先去看最新的1.3.0版本的：mmseg简介用来将一段文字，分成对应的(多个)词语。比如，将：张无忌在光明顶分为：无忌张无忌光明光明顶下载mmseg点击下载：得到mmseg-1.3.0.tar.gz。安装mmseg解压mmseg-1.3.0.tar.gz得到文件夹mmseg-1.3.0打开cmd，切换到目录mmseg-1.3.0运行se...
复制链接

扫一扫