python爬取天眼查存入excel表格_爬虫案例1——爬取新乡一中官网2018届高考录取名单...

weixin_39765280

于 2020-12-20 11:58:08 发布

阅读量991

点赞数

文章标签： python爬取天眼查存入excel表格

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39765280/article/details/111645684

版权

本文介绍了一个使用Python爬虫从新乡一中官网抓取2018届高考录取名单并保存到Excel表格的案例。通过学习网络爬虫知识，使用requests和BeautifulSoup库解析HTML，借助xlwt库将数据写入Excel。文章分为确定目标网页、写代码、运行程序和举一反三四个部分，详细阐述了整个过程。

摘要由CSDN通过智能技术生成

有一种非常常见并且相对简单的网络爬虫，工作流程大概是这样的：

访问目标网页
提取目标网页内表格信息
写入excel文件并保存

初次实践，我决定尝试写一个这样的爬虫。经过一番构思，我准备把爬取新乡一中官网上的高考录取名单作为自己的第一个案例。

写一个爬虫程序的想法是上周一(10月16日)冒出来的，然而那时的我对爬虫基本还一无所知，所以我首先恶补了一系列关于爬虫的知识，然后又去了解了一些将要用到的第三方库的用法。由于与此同时我还在狂刷C语言的课程，一直拖到前天(11月3日)我才做完了这个案例。

那么一起来看看这个案例吧！

需求分析&前期准备

目标：

用Python写一个程序，爬取新乡市一中官网上的高考录取名单，以姓名、录取高校两列的形式填入excel表格并保存在本地。

步骤拆分：

确定并访问目标网页
提取网页源代码
解析网页源代码
提取表格信息
建立excel文档、写入数据并保存

准备：

首先在中国大学mooc上恶补了一波关于网络爬虫的相关知识，主要是刷完了北

最低0.47元/天解锁文章

weixin_39765280

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。