php取名字的姓,【更新】爬取姓名大全的名字

最新推荐文章于 2022-07-19 15:40:09 发布

一笑逢

最新推荐文章于 2022-07-19 15:40:09 发布

阅读量210

点赞数

文章标签： php取名字的姓

接上文，可以不用一个网址一个网址的输入了，能抓取页面http://www.yw11.com/namelist.php

上列出的所有名字大全，不必再像上一个程序一样一个网址一个网址的输入了。嘿嘿。

#coding=utf-8

import urllib2

import re

from bs4 import BeautifulSoup

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

def getHtml(url):

page=urllib2.urlopen(url)

html=page.read()

return html

def getAllUrl(url):

html=getHtml(url)

soup=BeautifulSoup(html,'html.parser')

ul=soup.find_all('ul',attrs={'class':'e3'})[0]

a=ul.find_all('a')

# for i in a:

# urls=i['href']

# print urls

# print "一共有"+str(len(a))

return a

url='http://www.yw11.com/namelist.php'

user_agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_4) AppleWebKit/600.7.12 (KHTML, like Gecko) Version/8.0.7 Safari/600.7.12'

headers={"User-Agent":user_agent}

urls=getAllUrl(url)

f=open('name.txt','a')

for index in range(len(urls)):

lianjie=urls[index]['href']

mingzi=urls[index].text

print "正在抓取姓"+mingzi +"的名字......"

request=urllib2.Request(lianjie,headers=headers)

html=getHtml(request)

soup=BeautifulSoup(html,'html.parser')

divs=soup.find_all('div',attrs={"class":"listbox1_text"})[0]

ul=divs.find_all('ul')[0]

lis=ul.find_all('li')

for index in range(len(lis)):

name=lis[index].text.lstrip()#左对齐

f.write(name)

f.write('\r\n')

print "抓取了"+(str(index)+1)+"个"+mingzi+"名字"

f.close()

f=open('name.txt','r')

lines=f.readlines()

print "当前一共有"+str(len(lines))

f.close()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一笑逢

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

浅析php如何实现爬取数据原理

10-17

在当今的网络世界中，数据爬取是一个非常重要的技术领域，而PHP作为一种广泛使用的服务器端脚本语言，其在数据爬取方面的应用同样广泛。本文将深入探讨PHP如何实现爬取数据的原理，以及使用PHP中的QueryList工具进行...

php爬取天猫和淘宝商品数据

12-20

最近做了一个网站用到了从网址爬取天猫和淘宝的商品信息，首先看了下手机端的网页发现用的react，不太了解没法搞，所以就考虑从PC入口爬取数据，但是当爬取URL获取数据时并没有获取价格，库存等的信息，仔细研究了下...

参与评论您还未登录，请先登录后发表或查看评论

php取名字的姓,PHP随机生成中国人姓名的类

weixin_35912164的博客

03-10

760

随机生成国人的名字/*rndChinaName.class.php*/Class rndChinaName{private $arrXing,$numbXing;private $arrMing,$numbMing;function rndChinaName(){$this->getXingList();$this->getMingList();}/* 获取姓列表 */private ...

php取名字的姓,姓名拆分为姓氏和名字的方法[php版]

weixin_36285826的博客

03-10

612

/*** 把全名拆分为姓氏和名字* @param string $fullname 全名* @return array 一维数组,元素一是姓,元素二为名* @author: 风柏杨*/function splitName($fullname){$hyphenated = array('欧阳','太史','端木','上官','司马','东方','独孤','南宫','万俟','闻人','夏侯','诸葛...

PHP复姓判断,PHP拆分姓名中的姓氏和名字函数

weixin_42207707的博客

03-17

345

/*** 拆分姓名(姓氏和名字)* @param string $fullname 全名(如：百里屠苏)* @return array 一维数组[0=>'姓氏',1=>'名称']* @return array*/function splitName($fullname){$hyphenated = array('百里','北堂','北野','北宫','辟闾','淳于','成公','陈生...

PHP验证百家姓

liuzp111的专栏

05-05

2856

php验证百家姓

php 获取姓名拼音首字母

静下心来写代码

06-22

1771

来源url:http://www.open-open.com/home/space-926-do-blog-id-5580.html

phpspider:php爬虫，demo包含淘宝、天猫、京东等详情页的爬取

05-13

使用本框架，你不用了解爬虫的底层技术实现，爬虫被网站屏蔽、有些网站需要登录或验证码识别才能爬取等问题。简单几行PHP代码，就可以创建自己的爬虫，利用框架封装的多进程Worker类库，代码更简洁，执行效率更高...

saucey:一个主要用 PHP 编写的自动化框架，使用 Behat 和 Mink。旨在踢屁股和取名字

06-02

旨在踢屁股和取名字。 ##它有什么作用？该框架允许测试人员：控制 PC 的大部分方面，即使用 Xcode 的 iOS 模拟器打开原生 iOS 应用程序等。 Click 、 right-click 、 double-click 、 triple-click并通过 X/Y ...

提取文章中的人名php,php – Laravel – 如何从单独的字段中获取名字和姓氏,并将它们存储在db中的名称列中？...

weixin_31937605的博客

03-16

460

所以我在我的项目中使用了php artisan make：auth,我正在构建它.问题是它只有“name”字段而不是“firstName”和“lastName”字段.我在哪里配置这些选项？我想从名字和姓氏中获取输入,并将它们与它们之间的空格连接起来,然后将它们作为名称存储在我的数据库中.在哪里可以做到这一点？我在哪里配置我的选项,如果我想为我的用户添加地址或电话号码？我研究了很多,我真的很困惑所有...

php 常用词库,PHP常用的名词库及概念_php

weixin_33379878的博客

03-20

362

什么是序列化?PHP不支持永久对象，在OOP中永久对象是可以在多个应用的引用中保持状态和功能的对象，这意味着拥有将对象保存到一个文件或数据库中的能力，而且可以在以后装入对象。这就是所谓的序列化机制。PHP 拥有序列化方法，它可以通过对象进行调用，序列化方法可以返回对象的字符串表示。然而，序列化只保存了对象的成员数据而不包话方法。什么是构造函数?构造函数是类中的一个特殊函数，当使用 new 操作符创...

php 姓氏表,PHP拆分姓名中的姓氏和名字函数

weixin_32556315的博客

03-11

335

提取文章中的人名php,php中实现将姓名拆分为姓氏和名字

weixin_39819576的博客

03-16

505

之前有分享了用javascript在客户端进行姓名拆分的方法，后应项目需要，又用PHP实现了，贴出来跟大家分享交流：/*** 拆分姓名(姓氏和名字)* @param string $fullname 全名(如：百里屠苏)* @return array 一维数组[0=>'姓氏',1=>'名称']* @author: 爱是西瓜* @return array*/function split...

PHP 取名字

weixin_37933545的博客

11-11

550

/** * 人名字 * @param $num //名字长度（不含姓氏） * @return mixed|string */ public static function getName($num) { //姓氏 $arrXing = ['赵','钱','孙','李','周','吴','郑','王','冯','陈','褚','卫','蒋','沈','韩','杨','朱','秦','尤','许','何','吕','...

python爬虫beautifulsoup爬取小说_【爬虫实例1】python3下使用beautifulsoup爬取数据并存储txt文件-Go语言中文社区...

weixin_28710999的博客

01-14

355

1：运行环境：python： 3.7.0系统：WindowsIDE：pycharm 20172：需要安装的库：requests和beautifulsoup3：完整代码：# coding:utf-8import requestsfrom bs4 import BeautifulSoupimport bs4def gethtml(url,headers):response = requests.g...

使用python爬虫+lxml解析+BeautifulSoup爬取图片

weixin_40871749的博客

11-14

1213

本人这次用的lxml解析，BeautifulSoup，requsts。具体思路如下： 1）写一个获得源码的函数 2）写一个下载图片的函数 3）写一个获得首页上所有套图链接和名称的函数 4）写一个打开套图链接，并保存图片的函数代码如下： import requests,lxml,time fro...

python爬虫（一）BeautifulSoup解析网页

NANlantian的博客

01-16

1122

102 解析网页中的元素第一步使用BeautifulSoup解析网页 Soup = BeautifulSoup(html,'lxml') lxml：第二步描述要爬取的东西在哪 image = soup.select('???') 第三步从标签中获取信息，并整理格式放进容器中 <p>something</p>⬇️ {title = something rate = 40 } 103解析真实网页用Reques...

PHP用*号替代姓名除第一个字之外的字符

笑逐颜凯的博客

09-22

6824

/* * 作用：用*号替代姓名除第一个字之外的字符 * 参数： * * * 返回值：string */ function starReplace($name, $num = 0) { if ($num && mb_strlen($name, 'UTF-8') > $num) { return mb_substr($name, 0...

php 取姓名第一个字

lipengaccp的博客

07-19

380

php 取姓名第一个字php 取姓名第一个字

PHP汽车新闻数据爬取工具代码解析

资源摘要信息:"基于PHP的汽车新闻网爬取程序源码 php版.zip" 知识点说明: 1. PHP编程语言基础： - PHP（Hypertext Preprocessor，原名Personal Home Page）是一种广泛使用的开源服务器端脚本语言，特别适用于网页...