- 博客(2)
- 收藏
- 关注
原创 中文处理工具fastHan 2.0:支持中文分词、词性标注、命名实体识别、依存语法分析、中文AMR的强有力工具
fastHan2.0在fastHan原有的基础上,在训练数据集的种类和规模、模型架构、功能类型等都得到了极大的改进。可以说,fastHan2.0的能力得到了质的提升。相比于fastHan,fastHan2.0不但可以处理中文分词、词性标注、命名实体识别、依存分析多项任务,还可以对古汉语分词、古汉语词性标注进行处理。此外,fastHan2.0还可以处理中文AMR任务。fastHan在各项任务均有不错表现,在部分数据集上接近甚至超越SOTA模型。
2023-02-20 22:49:55 1952 2
原创 bert-ancient-chinese——专注于古汉语智能处理的BERT预训练模型
当下人工智能和数字人文浪潮风靡全球,现代汉语自动分析已取得很大成果,而古代汉语的自动分析研究相对薄弱。古汉语存在字词、词语、词类的诸多争议,资源建设困难重重。数字人文研究需要大规模语料库和高性能古文自然语言处理工具支持,本文通过在大规模古文语料上预训练得到专注于古汉语智能处理的预训练模型bert-ancient-chinese,其在下游任务的表现超过了现有的siku-bert等预训练模型。.........
2022-06-09 20:08:42 5490 10
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人