Python 抓取动态网页表格信息

本文介绍了如何使用Python抓取动态网页表格信息,分别通过requests和selenium两种方式进行。详细讲解了环境配置、所需库的安装、数据抓取的关键点以及注意事项,以集思录网站的可转债数据为例,展示了完整代码和运行结果。
摘要由CSDN通过智能技术生成

Python 抓取动态网页表格信息

 

 

五一假期,研究了下Python抓取动态网页信息的相关操作,结合封面的参考书、网上教程编写出可以满足需求的代码。由于初涉python,过程中曲折很多,为了避免以后遇到问题找不到相关的信息创建本文。

准备工具:

  1. Python 3.8
  2. Google Chrome浏览器
  3. Googledriver

测试网站:

1.集思录(https://www.jisilu.cn/data/cbnew/#cb)

测试前准备:

1.配置python运行的环境变量,参照链接(https://www.runoob.com/python3/python3-install.html)

 

*本次测试主要采取两种方式抓取动态网页数据,一是requests及json分析的方式;一是selenium的方式。requests方式速度快,但有一些元素的链接信息抓取不到;selenium方式通过模拟打开浏览器的方式进行数据的抓取,由于要打开浏览器因此速度相对较慢,但是可抓取的信息比较全面。

 

主要抓取的内容如下:(网站中的一些可转债数据)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值