selenium+pyquery自动化

Lguide

于 2021-05-07 20:48:05 发布

阅读量146

点赞数

分类专栏：数据分析方法爬虫

本文链接：https://blog.csdn.net/m0_37486489/article/details/116502285

版权

数据分析方法同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

爬虫

2 篇文章 0 订阅

订阅专栏

该博客使用selenium+pyquery爬取了豆瓣电影Top250的前250部电影的名称、导演和评分信息，并将这些数据保存到MySQL数据库中。通过遍历页面并等待页面加载，确保数据抓取的准确性。最终实现了从网页抓取到数据库存储的完整流程。

摘要由CSDN通过智能技术生成

使用selenium+pyquery爬取豆瓣top250，并保存数据库中(这里写自定义目录标题)

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import os
import time
from selenium.webdriver.common.keys import Keys
from pyquery import PyQuery as pq
import pymysql
chromedriver = "E:\chromeDriver\chromedriver.exe"
os.environ["webdriver.chrome.driver"] = chromedriver
driver  = webdriver.Chrome(chromedriver)
driver.maximize_window()
start_url = "https://movie.douban.com/top250"
for i in range(10):
    url = start_url+'?start='+str(25*i)+"&filter="
    driver.get(url)
    time.sleep(2)
    html = driver.page_source
    doc = pq(html)
    list = []
    for t in doc(".grid_view li"):
        name = pq(t).find('.info .hd .title').text()
        daoyan = pq(t).find(".info .bd p").text()
        pingjia = pq(t).find(".star span").text()
        list.append([name,daoyan,pingjia])
    # 打开数据库连接
    db = pymysql.connect(host="localhost", user="root", password="rootroot", database="pachong")
    # 使用cursor()方法获取操作游标 
    cursor = db.cursor()
    for  i in list:
        # SQL 插入语句
        sql = """INSERT INTO movie(name,
                 daoyan, pingjia)
                 VALUES (%s, %s,%s)"""
        try:
           # 执行sql语句
           cursor.execute(sql,i)
           # 提交到数据库执行
           db.commit()
        except:
           # 如果发生错误则回滚
           db.rollback()
    # 关闭数据库连接
    db.close()

Lguide

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
selenium+pyquery自动化

使用selenium+pyquery爬取豆瓣top250，并保存数据库中(这里写自定义目录标题)from selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsimport osimport timefrom selenium.webdriver.common.keys import Keysfrom pyquery import PyQuery as pqimport
复制链接

扫一扫