python爬取手机归属地

用python+bs4爬取了手机归属地数据:
 
import urllib.request
from bs4 import BeautifulSoup

def spider1(url):

    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11',
    'Accept':'text/html;q=0.9,*/*;q=0.8'
    }

    opener = urllib.request.build_opener()
    opener.addheaders = [headers]

    source_code=opener.open(url).read()
    soup=BeautifulSoup(source_code,"html.parser",from_encoding="gbk")
    for link in soup.find_all('dd'):
        baseurl=r'http://guisd.com'+link.a['href']+r'all/'
        haoduan=link.a.text
        print(haoduan)
        source_code=opener.open(baseurl).read()
        soup=BeautifulSoup(source_code,"html.parser",from_encoding="gbk")
        for tabb in soup.find_all('tr')[1:]:
            for tdd in tabb.find_all('td')[0:6]:
                f.writelines(tdd.get_text()+',')
            f.writelines('\n')         
f=open('text.txt','w+')
spider1('http://guisd.com/lb/')
f.close()

最终效果如下:

转载于:https://www.cnblogs.com/stephen2016/p/6101978.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值