selenium二或者三层连接爬取

本文通过Python的Selenium库,演示了如何实现对猫眼电影网站上各地区电影院信息的深层爬取。详细步骤包括设置URL、解析地区、遍历电影院等关键操作。
摘要由CSDN通过智能技术生成

今天的案例以猫眼影院为例:
爬取里面各个地区,各地的电影院的所有信息
url:https://maoyan.com/cinemas

import requests
from lxml import etree
from selenium import webdriver
from urllib import request,parse
import time


dirver=webdriver.PhantomJS(executable_path=r'D:\ysc桌面\Desktop\phantomjs-2.1.1-windows\bin\phantomjs.exe')
#dirver=webdriver.Chrome()

#代理ip
proxy = {
   
    "HTTP": "113.3.152.88:8118",
    "HTTPS": "219.234.5.128:3128",
}
#伪装头
headers = {
   
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)Chrome/70.0.3538.110 Safari/537.36",
}

#地址
base_url="https://maoyan.com/cinemas"

#打开网页获取信息
response= requests.get(url=base_url,headers=headers,proxies=proxy)
html=response.content.decode("utf-8")
with open("maoyan.html","w",encoding="utf-8")as fb:
    fb.write(html)
    
#调用etree.HTML进行树状转换
html_tree = etree.HTML(html)
#获取品牌id 行政区id 特殊厅id
li_tree=html_tree.xpath('//ul[@class="tags-lines"]/li')

#获取品牌id
brandId_dict={
   }
for i in li_tree[0].xpath('./ul/li')[1
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值