中文信息处理——分词评价程序（计算分词结果的准确率，召回率，F测度）

最新推荐文章于 2023-01-01 10:39:24 发布

最新推荐文章于 2023-01-01 10:39:24 发布

阅读量3.1k

点赞数 14

分类专栏：中文信息处理文章标签： python nlp

本文链接：https://blog.csdn.net/weixin_45884316/article/details/114923319

版权

中文信息处理专栏收录该内容

12 篇文章 40 订阅

订阅专栏

# 将词保存成集合形式
def getWord(str):
    list = []
    s = 0
    for word in str.split("/"):
        e = s + len(word)
        list.append((s, e - 1))
        s = e
    return set(list)

# ori是原来的分词，pred是系统预测的输出
def evaluate(ori,pred):
    predSize = len(getWord(pred))
    oriSize = len(getWord(ori))
    rightSize = len(getWord(ori)&getWord(pred))
    # Recall
    R = rightSize/oriSize
    # Precision
    P = rightSize/predSize
    # F-measure
    F = 2*P*R/(P+R)
    return R,P,F

pred_1 = "我/来到/北京/清华/大学"
pred_2 = "我/来到/北京/清华大学"
ori = "我/来到/北京/清华大学"

print(evaluate(pred_1,ori))
print(evaluate(pred_2,ori))

在这里插入图片描述

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

关注关注

14
点赞
踩
48

收藏

觉得还不错? 一键收藏
5
评论
中文信息处理——分词评价程序（计算分词结果的准确率，召回率，F测度）

# 将词保存成集合形式def getWord(str): list = [] s = 0 for word in str.split("/"): e = s + len(word) list.append((s, e - 1)) s = e return set(list)# ori是原来的分词，pred是系统预测的输出def evaluate(ori,pred): predSize = len(getWord(
复制链接

扫一扫