自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 中文处理工具fastHan 2.0:支持中文分词、词性标注、命名实体识别、依存语法分析、中文AMR的强有力工具

fastHan2.0在fastHan原有的基础上,在训练数据集的种类和规模、模型架构、功能类型等都得到了极大的改进。可以说,fastHan2.0的能力得到了质的提升。相比于fastHan,fastHan2.0不但可以处理中文分词、词性标注、命名实体识别、依存分析多项任务,还可以对古汉语分词、古汉语词性标注进行处理。此外,fastHan2.0还可以处理中文AMR任务。fastHan在各项任务均有不错表现,在部分数据集上接近甚至超越SOTA模型。

2023-02-20 22:49:55 1952 2

原创 bert-ancient-chinese——专注于古汉语智能处理的BERT预训练模型

当下人工智能和数字人文浪潮风靡全球,现代汉语自动分析已取得很大成果,而古代汉语的自动分析研究相对薄弱。古汉语存在字词、词语、词类的诸多争议,资源建设困难重重。数字人文研究需要大规模语料库和高性能古文自然语言处理工具支持,本文通过在大规模古文语料上预训练得到专注于古汉语智能处理的预训练模型bert-ancient-chinese,其在下游任务的表现超过了现有的siku-bert等预训练模型。.........

2022-06-09 20:08:42 5490 10

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除