python 中文姓名库_中文人名语料库。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。...

中文人名语料库(Chinese-Names-Corpus)

业余项目“萌名NameMoe(一个基于语料库技术的取名工具)”的副产品。

不定期更新。只删词,不加词。

可用于中文分词、人名识别。

请勿将本库打包上传其他网站挣积分,已上传的请配合删除,谢谢!

中文常见人名(Chinese_Names_Corpus)

数据大小:120万。

语料来源:从亿级人名语料中提取。

数据清洗:已清洗,但仍存有少量badcase。

新增人名生成器。

中文古代人名(Ancient_Names_Corpus)

数据大小:25万。

语料来源:多个人名词典汇总。

数据清洗:已清洗。

中文姓氏(Chinese_Family_Name)

数据大小:1千。

语料来源:从亿级人名语料中提取。

数据清洗:已清洗。

中文称呼(Chinese_Relationship)

数据大小:5千,称呼词根;18万,中文称呼。

语料来源:多个人名词典汇总。

数据清洗:已清洗,但仍存有大量badcase。

英文人名语料库(English-Names-Corpus)

翻译人名(English_Cn_Name_Corpus)

数据大小:48万。

语料来源:多个人名词典汇总。

数据清洗:已清洗,但仍存有少量badcase,以地名居多。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值