python 爬手机号_【Python爬虫】手机号网段爬虫

整体爬虫逻辑:

1.获取省份和城市的定位,然后定位出各个城市和相对应的url

2.获取到 130 xx号段 (共317个)中的xxx个

3867c046269f

3.获取最终的号段号码

先贴上源码

#抓取省份及城市

import requests

from lxml import etree

url='http://www.51hao.cc/'

req=requests.get(url)

req.encoding='gb2312'

html=req.text

select=etree.HTML(html)

infos=select.xpath('//div[@class="fkce"]/div[@class="fkt"][position()>1]')

#print(len(infos)) #核对下省的数量是否一致

for info in infos:

#定位省的地址

province=info.xpath('div[@class="fkbj"]/p/a/text()')[0]

#print(province)

#定位城市

citys=info.xpath('div[@class="fklk"]/p/a/text()

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值