1.QC简介
1.1QueryCorrection(QC)
QC顾名思义,就是将用户输入的错误检索串,进行模型计算,推测用户意图,发现能真正满足用户搜索需求的正确输入形式,并将正确结果展现给用户,从而帮助用户更快的找到所需的信息,最终满足查询的需求。
1.2QC形式
QC包含两种形式,一类是单词拼写错误,早期的英文串纠错就是通过字典进行单词正确性的纠错;第二类是上下文搭配不当引起的错误。在中文中不存在第一类的错字情况,只有字与字搭配的词条是否合理,或者一连串词条搭配能否组成一个通顺的句子,所以中文纠错主要解决的是上下文搭配问题。
1.3QC作用
召回 |
|
精度 |
|
直达区 |
|
1.4QC类型
错误类型 |
纠错示例 |
数字 |
2408->2048 |
英文 |
Fiappy->flappy Whatasapp->whatsapp |
拼音 |
Talang->踏浪 wangfei ->王菲 |
简拼 |
Zgr->中国人/张国荣 Xiaopg->小苹果 |
缺字 |