中文拼写纠错
文章平均质量分 92
华师数据学院·王嘉宁
研究方向:深度学习、自然语言处理、知识图谱。
研究兴趣:大语言模型训练与推理、知识增强预训练、Prompt-tuning、小样本学习、问答系统、信息抽取。
展开
-
中文拼写检测(Chinese Spelling Checking)相关方法、评测任务、榜单
中文拼写检测(Chinese Spelling Checking)相关方法、评测任务、榜单 中文拼写检测(Chinese Spelling Checking,CSC)是近两年来比较火的小众任务,在包括ACL、EMNLP等顶会上发展迅速。本文简单介绍CSC任务,相关方法、评测任务和榜单。一、中文拼写检测 中文拼写检测(Chinese Spelling Checking,CSC)又称中文拼写纠错(Chinese Spelling Correction,CSC),其旨在根据上下文来识别并纠正错误的拼写问原创 2022-02-07 13:31:21 · 4961 阅读 · 7 评论 -
论文解读:SpellBERT:A Lightweight Pretrained Model for Chinese Spelling Checking
论文解读:SpellBERT:A Lightweight Pretrained Model for Chinese Spelling Checking简要信息:序号属性值1模型名称SpellBERT2发表位置EMNLP20213所属领域自然语言处理、中文拼写纠错4研究内容中文拼写纠错5核心内容预训练语言模型6GitHub源码7论文PDFhttps://dl.acm.org/doi/10.1145/3404835.346原创 2022-02-07 11:02:49 · 1717 阅读 · 0 评论 -
论文解读:Dynamic Connected Networks for Chinese Spelling Check
论文解读:Dynamic Connected Networks for Chinese Spelling Check 我们知道,拼写纠错任务比较类似预训练语言模型中的**Masked Language Modeling(MLM)**任务。但是MLM有一个缺陷是每个token的预测是独立的,而在纠错任务中,存在错误的字符往往在纠正时需要考虑前后字符的依赖关系。基于此动机,本文提出一种动态连接网络以构建模型输出部分相邻字符之间的相关性。简要信息:序号属性值1模型名称DCN原创 2022-02-06 11:36:35 · 1352 阅读 · 0 评论 -
论文解读:DCSpell:A Detector-Corrector Framework for Chinese Spelling Error Correction
介绍在SIGIR2021发表的一篇中文拼写纠错文章——DCSpell。原创 2022-02-06 11:13:13 · 1260 阅读 · 0 评论 -
论文解读:Global Attention Decoder for Chinese Spelling Error Correction
论文解读:Global Attention Decoder for Chinese Spelling Error Correction(ACL2021)简要信息:序号属性值1模型名称GAD2所属领域自然语言处理、中文拼写纠错3研究内容中文拼写纠错4核心内容Global Attention Decoder5GitHub源码6论文PDFhttps://aclanthology.org/2021.findings-acl.122.pd原创 2021-11-28 19:51:29 · 1315 阅读 · 0 评论 -
论文解读:Correcting Chinese Spelling Errors with Phonetic Pre-training
论文解读:Correcting Chinese Spelling Errors with Phonetic Pre-training(ACL2021) 中文拼写纠错CSC任务具有挑战性,目前的SOTA方法是仅使用语言模型,或将语音信息作为外部知识;本文将提出一种新的端到端的CSC模型,将phonetic(拼音)特征融入到预训练和微调部分:我们在预训练阶段,每次随机将某个token替换为sound-alike的词;提出adaptive weighted联合训练detection和correction原创 2021-11-25 14:26:42 · 3101 阅读 · 0 评论 -
论文解读:Spelling Error Correction with Soft-Masked BERT
论文解读:Spelling Error Correction with Soft-Masked BERT(2020ACL) 拼写错误纠错是一个比较重要且挑战的任务,非常依赖于人类的语言理解能力。本文关注中文的拼写错误纠错任务(Chinese Spelling Error Correction)。目前SOTA的方法是给予BERT模型,为句子中的每一个词,从候选的字符列表中挑选一个作为纠错的结果,然而这类方法容易陷入局部最优。然而,因为 BERT 没有足够的能力来检测每个位置是否有错误,显然是由于使用掩码语原创 2021-11-25 14:03:25 · 1526 阅读 · 0 评论 -
论文解读:ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information
论文解读:ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information(2021ACL)简要信息:序号属性值1模型名称ChineseBERT2所属领域自然语言处理、中文预训练语言模型3研究内容预训练语言模型4核心内容BERT应用5GitHub源码https://github.com/ShannonAI/ChineseBert6论文PDFhttp原创 2021-11-19 17:31:04 · 2394 阅读 · 0 评论 -
论文解读:SpellGCN: Incorporating Phonological and Visual Similarities into Language Models for Chinese S
论文解读:SpellGCN: Incorporating Phonological and Visual Similarities into Language Models for Chinese Spelling Check(2020ACL)简要信息:序号属性值1模型名称SpellGCN2所属领域自然语言处理3研究内容中文拼写纠错4核心内容语言模型、图神经网络5GitHub源码https://github.com/ACL2020Spel原创 2021-09-12 22:36:47 · 1259 阅读 · 0 评论 -
论文解读:FASPell: A Fast, Adaptable, Simple, Powerful Chinese Spell Checker Based On DAE-Decoder Paradig
论文解读:FASPell: A Fast, Adaptable, Simple, Powerful Chinese Spell Checker Based On DAE-Decoder Paradigm简要信息:序号属性值1模型名称FASPell2所属领域自然语言处理3研究内容中文拼写纠错4核心内容图表征,语言模型5GitHub源码https://github.com/iqiyi/FASPell6论文PDFhttps://acl原创 2021-09-12 22:11:48 · 913 阅读 · 0 评论