python爬取北京小学学校信息

最新推荐文章于 2023-11-21 09:32:49 发布

学喳喳

最新推荐文章于 2023-11-21 09:32:49 发布

阅读量555

点赞数

分类专栏： python爬虫文章标签： python爬虫

本文链接：https://blog.csdn.net/qq_31194443/article/details/90110239

版权

python爬虫专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.目标：爬取北京所有的小学名单
链接：http://beijing.xuexiaodaquan.com/xiaoxue/pn30.html
分析：
在这里插入图片描述
代码：

from urllib.request import urlopen
from bs4 import BeautifulSoup
for i in range(30):
    html = urlopen('http://beijing.xuexiaodaquan.com/xiaoxue/pn'+str(2)+'.html')
    bsObj = BeautifulSoup(html, 'lxml')
    nameList = bsObj.findAll('div', {'class': 'list-xx clearfix'})
    for name in nameList:
        first=name.select('a')
        for i in range(len(first)):#表示从0到xml的len()长度
            if i%2!=0:
                print(first[i].string)

效果：
在这里插入图片描述