python 随机生成中文名字

#功能描述:随机生成一个中文名字

import
random import json from conf.setting import FIRSTNAME, LASTNAME def random_name():#定义一个函数 first_name_list = open(FIRSTNAME, encoding='utf-8')#打开文件,获取文件句柄 last_name_list = open(LASTNAME, encoding='utf-8') first_names = json.load(first_name_list)#从文件中获取用load读取文件,并且把文件中的字符串转换成列表 last_names = json.load(last_name_list) name_all = random.choice(last_names) + random.choice(first_names) + random.choice(first_names)#从列表中获取一个字儿,从另一个列表中获取两个字儿,把字儿都拼接到一起。return name_all random_name()

这里面有两个常量,FIRSTNAME, LASTNAME ,是两个文件里面存着json串格式,import jso#下面是两个汉字的列表

last_names = ['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '',
              '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '',
              '', '', '', '', '', '', '', '']

first_names = ['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '',
               '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '',
               '', '', '']

res = json.dumps(first_names, ensure_ascii=False)#把frist_names列表转换成json字符串
print(res)#打印出来是一个字符串类型的列表
print(type(res))#打印res类型是字符串
f = open('first_names.json', 'w', encoding='utf8')#打开文件,赋给f文件句柄
f = open('last_names.json', 'w', encoding='utf8')#打开文件,赋给f文件句柄
json.dump(first_names, f, ensure_ascii=False, indent=10)#直接写入文件了,不需要再f.write,写入以后还有缩进,是json格式
json.dump(first_names, f, ensure_ascii=False, indent=10)#直接写入文件了,不需要再f.write,写入以后还有缩进,是json格式





 

转载于:https://www.cnblogs.com/wmm007/p/7804805.html

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
中文信息计算机自动处理的研究已有几十年的 历史 , 但至今仍有许多技术难题没有得到很好解 决 , 中文姓名自动识别问题就是其中的一个。由于 它与中文文本的自动分词一样 , 属于中文信息处理 的基础研究领域 , 因而它的研究成果直接影响到中 文信息的深层次研究。汉语的自身特点使得中文信 息自动处理大多是先对要处理的文本进行自动分词 (加入显式分割符) , 然后再在分词的基础上进行词 法、语法、语义等方面的深入分析。而在分词阶 段 , 文本中的人名、地名以及其它专有名词和生词 大多被切分成单字词 , 在这种情形下如不能很好地 解决汉语文本中专有名词生词的识别问题 , 将给其 后的汉语文本的深入分析带来难以逾越的障碍。中 文姓名的自动识别问题就是在这种背景下提出来 的。对这一问题的研究目前采用的技术中主要利用 以下几方面的信息: 姓名用字的频率信息、上下文 信息[1 ,2 ] 、语料库统计信息[2 ] 、词性信息等[3 ] 。本 文的方法是 , 首先对中文人名的构成、姓名用字的 规律及上下文文本信息特征进行充分分析 , 在此基 础上建立起两组规则集 , 将其作用于测试文本 , 获 得初步识别结果 , 再利用大规模语料库的统计信息 对初步识别结果进行概率筛选 , 设定合适的阈值 , 输出最终识别结果。经对 50 多万字的开放语料测 试 , 系统自动识别出 1781 个中文人名 , 在不同的 筛选阈值下获得 90 %以上的识别准确率 , 而召回 率高于 91 %。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值