目录:
1. 【案例】re屠戮电影天堂
1.目的:
- 定位到2021新片精品
- 从2021新片精品中提取到子页面的链接地址
- 请求子页面的链接地址,拿到我们想要的下载地址…
1. 定位到2021新片精品
我想得到这里的电影的下载地址。
1. 出现错误???
2. 网页乱码???
python抓包回来,默认进行utf8编码了,但是 如果网页的编码不是utf8的话,就会出现这样的乱码
网站的编码通常会进行声明,
然后我们进行换一下编码就好了
我们的唯一标识就是 2021新片精品
2.从2021新片精品中提取到子页面的链接地址
3.请求子页面的链接地址,拿到我们想要的下载地址…
# -*- coding: utf-8 -*-
# @Time: 2021/5/5 14:05
# @Author: adam
# @File: demo2.py
import csv
import re
import requests
header = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'