前向、后向最大匹配

Max_Len=4 #最大长度
#前向最大匹配
def MM(query,your_dict,Max_Len):
    mm_query_label=[]
    len_query=len(query)
    while(len_query>0):
        cur_len = min(len_query,Max_Len)
        cur_text =query[:cur_len]
        ner_flag = False # 标记是否找到匹配向
        while cur_len > 0:
            # 检查当前长度是否找到
            if cur_text in your_dict:
                ner_flag = True
                mm_query_label.append(cur_text)
                query = query[cur_len:]
                len_query = len(query)
#                 print(cur_text)
                break
            if not ner_flag: #没有找到,缩短长度
                cur_text = cur_text[:-1]
                cur_len -= 1            
        # 如果退出都没有找到,向前一步
        if not ner_flag:
            mm_query_label.append(query[0])
            query = query[1:]
            len_query=len(query)
    return mm_query_label
#后向最大匹配
def RMM(query,your_dict,Max_Len):
    rmm_query_label=[]
    len_query=len(query)
    while(len_query>0):
        cur_len = min(len_query,Max_Len)
        cur_text =query[-cur_len:]
        ner_flag = False # 标记是否找到匹配向
        while cur_len > 0:
            # 检查当前长度是否找到
            if cur_text in your_dict:
                ner_flag = True
                rmm_query_label.append(cur_text)
                query = query[:-cur_len]
                len_query = len(query)
                print(cur_text)
                break
            if not ner_flag: #没有找到,缩短长度
                cur_text = cur_text[1:]
                cur_len -= 1      
        # 如果退出都没有找到,向前一步
        if not ner_flag:
            rmm_query_label.append(query[-1])
            query = query[:-1]
            len_query=len(query)    
    return rmm_query_label[::-1] 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值