爬虫学习任务笔记概要(第四次)--实战某新闻爬取项目含代码

本次学习任务涉及ajax加载研究,通过chrome开发者工具触发请求获取数据,并利用selenium模拟浏览器操作。数据解析借助beautiful soup4,最终将数据存储为csv文件。感谢FlyApple同学的指导和助教老师及同学们的帮助。
摘要由CSDN通过智能技术生成

大作业要求:

1、了解ajax加载
2、通过chrome开发工具,触发请求,并获取数据
3、用到selenium库
在这里插入图片描述

思路如下:

1、用selenium模拟浏览器操作,获得ul/li下面的data
2、用beautiful soup4解析缓存下来的data
3、加载pandas库,将data导出至csv文件

import time
from  selenium import webdriver
driver=webdriver.Chrome(executable_path="C:\Program Files\Anaconda3\chromedriver.exe")
driver.get("https://news.qq.com")
#进程挂起时间2s
for i in range(1,50):
    time.sleep(2)
    driver.execute_script
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值