selenium + Chrome自动化多线程爬取腾讯动漫漫画,项目实战

本文使用selenium + Chrome + + requests + 多进程的方式进行爬取
本文只能爬取免费的漫画,对于付费的漫画没有做相关的处理
本文仅供学习交流使用,严禁用于商业用途

开门见山。直接上代码

先进行导入模块,项目初始化

from selenium import webdriver
import requests
import os,sys
import time


class Tencent(object):
  def __init__(self,url='https://ac.qq.com/ComicView/index/id/505430/cid/1'):
    #当前文件路径
    self.path = os.path.dirname(os.path.realpath(sys.argv[0]))
    #设置消息头
    self.headers = {
   "User-Agent":"Mozilla/5.0"}
    #传入要爬取的url
    #测试页面,腾讯动漫海贼王第一话
    self.url = url

打开网页,从顺序模式切换到对页模式,网站默认是顺序阅读模式

  def open_url(self):
    self.driver.get(self.url)
    #先切换至对页模式,因为腾讯动漫采用异步加载模式且使用driver.execute_script()方法无法操作界面,
    #但是点击事件可以正常触发,所以为了方便,可切换到对页模式
    self.driver.find_element_by_id('crossPage').click()
    self.
  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值