本文以人名邮电出版社官网为例来获取相关搜索内容图书的价格和书名信息,得到的结果再通过pandas里的DataFrame生成一个简单的表格。完整代码和有关解析如下:
#导入selenium的相关库
from selenium import webdriver
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import Bydriver=webdriver.Chrome() #使用谷歌浏览器新建窗口,并创建一个名为driver的对象
driver.get('https://www.ptpress.com.cn/shopping/index') #里面的是人名邮电出版社的网址
wait=WebDriverWait(driver,20) #页面等待最长时间为20秒,否则报错#下面括号里长长的内容是利用谷歌开发者工具获取的搜索框selector
search_btn=driver.find_element_by_css_selector(
'body > div.classifySearch-p > div > div.classifySearchBar > div.allSearch > input'
)
search_btn.send_keys('python编程') #传送数据到弹出的那个浏览器搜索框里面#设置等待的特定条件,括号里长长的内容是开发者工具里面定位到搜索的selector
confirm_btn=wait.until(<