- 最初的源代码
import re
from selenium import webdriver
import time
browser = webdriver.Chrome()
url = 'http://www.sse.com.cn//disclosure/credibility/supervision/inquiries/'
browser.get(url)
time.sleep(3) #这里必须加3秒的延迟,因为需要等待网页加载完毕
data = browser.page_source
#print(data)
import pandas as pd
table_all = pd.DataFrame()
for i in range(10): #爬取前10页的表格
browser.find_el

本文介绍使用Selenium和Pandas进行网页爬取的过程,重点展示了如何通过XPath定位元素及读取表格数据的方法,并实现了对特定网站前10页数据的抓取。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



