1-NED 指的是normalized edit distance, 是在《ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboard》里定义的
1-NED就是1 减 NED
edit distance 编辑距离
在NLP任务中经常会碰到比较两个字符串的相似度,比如拼写纠错和指代判断。用户很可能在搜索时输入错别字,比如“微信”输成了“为信”,但是搜索引擎返回的结果纠正为“微信”的搜索结果,如图1-1。另外比如“北京大学校长”和“北大校长”,“北京故宫博物院”和“北京故宫”都是指的同一个人或事物。
上述问题,可以利用两个词或短语的编辑距离大小来解决。
利用编辑距离可以判断两个字符串的相似程度,即从一个字符串到另一个字符串所需要的编辑次数,包括插入字符,删除字符及替换字符这三种操作
1-NED
于 2021-04-28 10:46:51 首次发布