Python爬数据之全国中小学信息

本文介绍了使用Python的requests和BeautifulSoup库爬取全国中小学信息的过程。由于目标网站具有反爬虫机制,需要更换IP来应对。同时,需要准备一个包含中国城市名称及其拼音的Excel表格,以便进行数据匹配。最终,爬取的结果将导出为一个包含各学校信息的Excel文件。
摘要由CSDN通过智能技术生成

爬取网站:http://www.xuexiaodaquan.com/ 学校大全

技术路线: requests + BeautifulSoup

貌似这个网站反爬虫还挺牛的,经常就返回自动跳入的139网站,随意得换着IP试试

需要准备中国市名称拼音存在EXCEL中,显示是第一列:市民;第二列:拼音;到市级就可以。

需要挖掘哪些城市就放哪些,如果挖全国,就要放所有市名。

如:


输出是一个EXCEL&#

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值