python爬取天眼查存入excel表格_爬虫案例1——爬取新乡一中官网2018届高考录取名单...

本文介绍了一个使用Python爬虫从新乡一中官网抓取2018届高考录取名单并保存到Excel表格的案例。通过学习网络爬虫知识,使用requests和BeautifulSoup库解析HTML,借助xlwt库将数据写入Excel。文章分为确定目标网页、写代码、运行程序和举一反三四个部分,详细阐述了整个过程。
摘要由CSDN通过智能技术生成
  有一种非常常见并且相对简单的网络爬虫,工作流程大概是这样的:
  • 访问目标网页

  • 提取目标网页内表格信息

  • 写入excel文件并保存

初次实践,我决定尝试写一个这样的爬虫。 经过一番构思,我准备把爬取新乡一中官网上的高考录取名单作为自己的第一个案例。

写一个爬虫程序的想法是上周一(10月16日)冒出来的,然而那时的我对爬虫基本还一无所知,所以我首先恶补了一系列关于爬虫的知识,然后又去了解了一些将要用到的第三方库的用法。由于与此同时我还在狂刷C语言的课程,一直拖到前天(11月3日)我才做完了这个案例。

那么一起来看看这个案例吧!

需求分析&前期准备

目标:

用Python写一个程序,爬取新乡市一中官网上的高考录取名单,以姓名、录取高校两列的形式填入excel表格并保存在本地。

步骤拆分:
  1. 确定并访问目标网页

  2. 提取网页源代码

  3. 解析网页源代码

  4. 提取表格信息

  5. 建立excel文档、写入数据并保存

准备:

首先在中国大学mooc上恶补了一波关于网络爬虫的相关知识,主要是刷完了北

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值