简单的逆向最大匹配算法实现中文分词（Python）

最新推荐文章于 2024-07-30 18:05:17 发布

T_world

最新推荐文章于 2024-07-30 18:05:17 发布

阅读量5.8k

点赞数 3

分类专栏：杂文章标签： python 算法逆向最大匹配

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/runner__1/article/details/78376639

版权

本文介绍了如何使用Python实现逆向最大匹配法进行中文分词，强调了词典文件应采用utf-8编码。

摘要由CSDN通过智能技术生成

Python实现逆向最大匹配中文分词，注意的是作为词典的文件编码格式应该为utf-8.

# -*- coding: utf-8 -*-
# BMM
# 使用逆向最大匹配算法实现中文分词
dic = []


def init():
    """
    读文件
    获取中文词典
    :return:
    """
    input = open("test.txt")
    lines = input.readlines()
    for line in lines:
        line = line.decode("utf8")
        temp = line.split(',')
        dic.append(temp[0])
    # for d in dic:
    #     print d


def if_contain(words):
    """
    判断当前词在词典中是否存在
    :param words:
    :return:
    """
    words = words.decode("utf8")
    flag = False
    for d in dic:
        if d == words:
            flag = True
            break
    return flag


def spl(sentence):
    """
    逆向最大匹配算法的主要实现部分
    从后向前切割字符串，直到切割出的子串与词典中的词匹配
    :param sentence:
    :return:

最低0.47元/天解锁文章

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

T_world CSDN认证博客专家 CSDN认证企业博客

码龄10年

126: 原创

18万+: 周排名

202万+: 总排名

31万+: 访问

: 等级

3877: 积分

43: 粉丝

124: 获赞

58: 评论

271: 收藏

私信

关注

热门文章

分类专栏

算法 4篇
JavaWeb 13篇
最小生成树 6篇
动态规划 11篇
匈牙利算法 6篇
最短路径 3篇
搜索 6篇
并查集 2篇
数论 3篇
水 6篇
博弈 8篇
云 2篇
网络流 1篇
数学 3篇
递推 4篇
杂 26篇
Android 7篇
数据结构 2篇
Linux 3篇
Python 4篇
shell
ML 1篇

最新评论

Android studio报错：app:mergeDebugResources FAILED（记一次痛苦不堪的debug）
SevenUUp: 以前的eclipse错误很容易排查，现在的Android studio各种插件版本得兼容，引一个依赖包就可能必须得更新插件版本，跨度大得话还得把整个项目里引入得低版本插件都排查一遍才能找到原因
Android studio报错：app:mergeDebugResources FAILED（记一次痛苦不堪的debug）
qq_38583852: 感动. 真恶心这个错误,毛的提示都没有,都不知道从哪里入手
ajax调用controller后页面无法跳转的问题
cherry_xixi: 你好 window.location.href里面直接写控制器的地址吗，不用写http:+端口号吗，我直接写控制器的地址跳转失败，加上http+端口号也失败
Android studio报错：app:mergeDebugResources FAILED（记一次痛苦不堪的debug）
金木研yan: 解决了，刚才是因为我照搬你的命令输进去了。后来我通过查看Build窗口发现我遇到的资源问题(mergeDebugResources)和你打并不一样，于是我根据我遇到的问题来输入就可以了-->gradlew mergeDebugResources --stacktrace
Android studio报错：app:mergeDebugResources FAILED（记一次痛苦不堪的debug）
金木研yan: 为什么我按你那样运行命令时它给我下一堆东西？

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。