python列表姓氏_Python 批量生成中文姓名（百家姓）

最新推荐文章于 2024-07-31 18:00:00 发布

weixin_39533174

最新推荐文章于 2024-07-31 18:00:00 发布

阅读量1.9k

点赞数

文章标签： python列表姓氏

本文链接：https://blog.csdn.net/weixin_39533174/article/details/111424683

版权

为了批量生成真实感的中文姓名，本文介绍了如何使用Python的urllib2和BeautifulSoup库从网上爬取百家姓大全网站上的姓名数据。通过解析网页，获取每个姓氏的前15个名字，实现了姓名数据的快速生成。

摘要由CSDN通过智能技术生成

最近需要造一部分数据，需要用到人名，与其用脚本生成一些随机组合的汉字，不如在网上爬一些看似真实的姓名，所以找来了姓氏大全的网站，网址：http://www.resgain.net/xsdq.html

上图可以看到有很多不同的姓氏，每个姓氏(又是一个网页)里边有很多名字，这样轻轻松松就可以搞定一些真实的数据了，

此时只需要获取名字即可。

用到的库有urllib2 bs4，首先就是用urllib2获取请求，然后用beautifulsoup将请求内容生成可分析对象，然后查找标签即可，很简单，上代码好了。

# -*- coding: utf-8 -*-

import urllib2

import sys

from bs4 import BeautifulSoup

reload(sys)

sys.setdefaultencoding("utf-8")

def get_name(url):

name_list = []

request = urllib2.Request(url) # 创建对名字大全网站get请求

result = urllib2.urlopen(request) # 发出请求

soup = BeautifulSoup(result.read(), ‘html.parser‘) # 生成可分析对象

if soup.find_all("a",class_="btn btn2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39533174

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

使用 Python 批量生成“百家姓”文字高清大图

水滴的博客

04-09

641

前一段时间看到很多人使用 AI 绘画工具生成“姓氏头像”的，于是自己也研究了一下。而这需要用到文字蒙版图片（黑字白底），为了方便，便使用 Python 完成了该功能。该代码可以生成文字图片，图片的大小、背景颜色、文字大小、文字颜色、文字字体等信息都可以自定义。只要将“百家姓”文字放到文本文件中，便可以批量生成文字。本代码使用的是 Pillow 库来完成的，我们先来了解一下：Pillow 是一个 Python 图像处理的第三方库，提供了广泛的图像处理功能和工具。

python拼音名_python生成随机中文姓名和拼音

weixin_31119281的博客

02-21

1021

def sayhello():print(‘hellopython‘)import pinyinimport randomdef random_name():# 删减部分，比较大众化姓氏firstName = "赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许何吕施张孔曹严华金魏陶姜戚谢邹喻水云苏潘葛奚范彭郎鲁韦昌马苗凤花方俞任袁柳鲍史唐费岑薛雷贺倪汤滕殷罗毕郝邬安常乐于时傅卞齐康伍余元卜顾孟平" ...

参与评论您还未登录，请先登录后发表或查看评论

python3爬取姓氏

12-16

用python3和Beautifusoup爬取姓氏，并存储到数据库中，适合python刚入门的同学下载学习，里面注释详细，大家也可以去我博客观看：http://blog.csdn.net/ma853756059/article/details/78819306 谢谢

python中文名字-Python 批量生成中文姓名（百家姓）

weixin_37988176的博客

11-01

1206

最近需要造一部分数据，需要用到人名，与其用脚本生成一些随机组合的汉字，不如在网上爬一些看似真实的姓名，所以找来了姓氏大全的网站，网址：http://www.resgain.net/xsdq.html上图可以看到有很多不同的姓氏，每个姓氏（又是一个网页）里边有很多名字，这样轻轻松松就可以搞定一些真实的数据了，此时只需要获取名字即可。用到的库有urllib2 bs4，首先就是用urllib2获取请求，...

nameparser，一个强大的 Python 库！

热门推荐

maozheng110的专栏

02-29

1万+

# coding:utf-8 import re name = input("输入你的姓名：") pattern = r'[赵|钱|孙|李|周|吴|郑|王|冯|陈|褚|卫|蒋|沈|韩|杨|朱|秦|尤|许|何|吕|施|张|孔|曹|严|华|金|魏|陶|姜|戚|谢|邹|喻|柏|水|窦|章|云|苏|潘|葛|奚|范|彭|郎|鲁|韦|昌|马|苗|凤|花|方|俞|任|袁|柳|酆|鲍|史|唐|费|廉|岑|薛|...

Python 批量生成中文姓名（百家姓）

weixin_30590285的博客

06-19

2362

　　最近需要造一部分数据，需要用到人名，与其用脚本生成一些随机组合的汉字，不如在网上爬一些看似真实的姓名，所以找来了姓氏大全的网站，网址：http://www.resgain.net/xsdq.html 上图可以看到有很多不同的姓氏，每个姓氏（又是一个网页）里边有很多名字，这样轻轻松松就可以搞定一些真实的数据了，此时只需要获取名字即可。　　用到的库有urllib2 bs4，首先就...

python爬虫获取百家姓

weixin_35749796的博客

01-14

507

下面是一个爬取百家姓的简单示例代码： import requests from bs4 import BeautifulSoup url = 'https://baike.baidu.com/item/%E7%99%BE%E5%AE%B6%E5%A7%93' response = requests.get(url) soup = BeautifulSoup(response.text, 'lxm...

python输出姓名_Python生成随机不重复姓名昵称

weixin_39692271的博客

11-24

1822

姓采用百家姓，名字从常用名字高频字选取两个汉字，再和当前时间戳组合，估计应该是不会重复了，代码如下：# -*- coding:utf-8 -*-import randomimport timedef random_name():xing = '赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许何吕施张孔曹严华金魏陶姜戚谢邹喻柏水窦章云苏潘葛' \'奚范彭郎鲁韦昌马苗凤花方俞任袁柳酆鲍史唐费廉岑薛雷贺倪汤滕殷...

python生成姓名,python生成随机姓名

weixin_42504279的博客

03-26

2393

在看csdn的时候无意看到一篇使用java生成随机中国姓名的文章，由于最近在学习python，就想着我也使用python写一个玩玩下面附上代码：# Chen yi cheng 创建时间：2019/6/14 14:09# ???????????????????import randomdef random_name():# 删减部分，比较大众化姓氏firstName = "赵钱孙李周吴郑王冯陈褚...

中文人名自动识别的一种有效方法

10-16

中文信息计算机自动处理的研究已有几十年的历史 , 但至今仍有许多技术难题没有得到很好解决 , 中文姓名自动识别问题就是其中的一个。由于它与中文文本的自动分词一样 , 属于中文信息处理的基础研究领域 , 因而它的研究成果直接影响到中文信息的深层次研究。汉语的自身特点使得中文信息自动处理大多是先对要处理的文本进行自动分词 (加入显式分割符) , 然后再在分词的基础上进行词法、语法、语义等方面的深入分析。而在分词阶段 , 文本中的人名、地名以及其它专有名词和生词大多被切分成单字词 , 在这种情形下如不能很好地解决汉语文本中专有名词生词的识别问题 , 将给其后的汉语文本的深入分析带来难以逾越的障碍。中文姓名的自动识别问题就是在这种背景下提出来的。对这一问题的研究目前采用的技术中主要利用以下几方面的信息: 姓名用字的频率信息、上下文信息[1 ,2 ] 、语料库统计信息[2 ] 、词性信息等[3 ] 。本文的方法是 , 首先对中文人名的构成、姓名用字的规律及上下文文本信息特征进行充分分析 , 在此基础上建立起两组规则集 , 将其作用于测试文本 , 获得初步识别结果 , 再利用大规模语料库的统计信息对初步识别结果进行概率筛选 , 设定合适的阈值 , 输出最终识别结果。经对 50 多万字的开放语料测试 , 系统自动识别出 1781 个中文人名 , 在不同的筛选阈值下获得 90 %以上的识别准确率 , 而召回率高于 91 %。

python爬虫不用库获取百家姓

weixin_35755188的博客

01-14

493

你可以使用 Python 的 requests 库来发送 HTTP 请求，并使用 BeautifulSoup 库来解析 HTML 页面。下面是一个示例代码： import requestsfrom bs4 import BeautifulSoup url = 'https://www.souzhou.com/xingming/xingshi/' response = requests.get(u...

手把手教你写爬虫——基于Python scrapy 的百家姓爬虫程序

yaovirus的专栏

06-02

666

1默认你已经安装好Python环境 2安装scrapy pip install Scrapy 3进入工作空间目录，在地址栏敲cmd，执行命令，创建项目 scrapy startproject Baijiaxing 4使用PyCharm打开项目，你也可以使用其他编码工具目录结构如下 6 进入项目目录 cd Baijiaxing 5在spider下创建我们自己的爬虫程序 baijiaxing scrapy genspider baijiaxing baijiaxing.5124

python随机中文姓名

kramer_1711的博客

07-02

3218

import random first_name_array = \ '赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许何吕施张孔曹严华金魏陶姜' \ '戚谢邹喻柏水窦章云苏潘葛奚范彭郎鲁韦昌马苗凤花方俞任袁柳酆鲍史唐' \ '费廉岑薛雷贺倪汤滕殷罗毕郝邬安常乐于时傅皮卞齐康伍余元卜顾孟平黄' \ '和穆萧尹姚邵堪汪祁毛禹狄米贝明臧计伏成戴谈宋茅庞熊纪舒屈项祝董梁' la...

python中文名字叫什么-Python为什么取名为Python，很少人知道

weixin_37988176的博客

11-01

1681

原标题：Python为什么取名为Python，很少人知道打开世界编程语言排行榜，出现在榜单上的语言名称多半都让人一头雾水。一些编程语言的作者会以「这种语言是什么」来命名语言，比如 BASIC、COBOL、TCL、LISP；另一些语言则是由它从哪些现有语言派生而来命名，像是 C++，C#；当然还有一些来源于数学家或计算机科学家的名字，其中的代表则是 Ada，Pascal，Turing。但也有很多程...

python是什么语言的脚本-Python代码是什么语言

weixin_37988176的博客

10-29

540

Python代码是一种计算机程序设计语言，是一种动态的、面向对象的脚本语言，最初是用来编写自动化脚本的，随着版本的不断更新和语言新功能的添加，越来越多被用于独立的、大型项目的开发。Python代码是：python的中文名称是蟒蛇。Python是一种计算机程序设计语言。是一种动态的、面向对象的脚本语言，最初是用来编写自动化脚本的，随着版本的不断更新和语言新功能的添加，越来越多被用于独立的、大型项目的...

PHP验证百家姓

liuzp111的专栏

05-05

2844

php验证百家姓

Python 如何随机生成姓名？

wuwei13798642的博客

08-17

3874

Python 如何随机生成姓名？

Python列表生成式与生成器实战指南

本文主要讲解了Python中列表生成式(List Comprehensions)与列表生成器(List Generators)的高效使用技巧。列表生成式是一种简洁、高效的创建新列表的方式，它通过单行表达式一次性生成整个列表，将所有元素计算并存储...