爬取腾讯视频 xpath方式

最新推荐文章于 2024-05-02 22:12:37 发布

@懒羊羊

最新推荐文章于 2024-05-02 22:12:37 发布

阅读量1.4k

点赞数 1

分类专栏：爬虫文章标签： xpath

本文链接：https://blog.csdn.net/qq_46659912/article/details/109304800

版权

以xpath方式爬腾讯视频里电影的链接，海报链接，演员，简介等
如 href=" " 这种类型数据，可以@href来提取
代码如下

import requests
from fake_useragent import UserAgent
from lxml import etree
import numpy as np
from pandas import DataFrame


class Tencent(object):
    def __init__(self):
        self.headers = {
   'User-Agent': UserAgent().firefox}
        self.onePage_url = 'https://v.qq.com/x/bu/pagesheet/list?append=1&channel=movie&itype=100062&listpage=2' \
                           '&offset={}&pagesize=30 '  # offset={
   } 是因为翻页是offset是变化的,值会在后面引入

    def get_page(self, url):
        req = requests.get(url=url, headers=self.headers).content.decode('utf-8')  # .content 存的是字节码，
        return req

    def parse_page(self, html):
        a = 'http:{}'</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

@懒羊羊

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
爬取腾讯视频 xpath方式

以xpath方式爬腾讯视频里电影的链接，海报链接，演员，简介等如 href=" " 这种类型数据，可以@href来提取import requestsfrom fake_useragent import UserAgentfrom lxml import etreeimport numpy as npfrom pandas import DataFrameclass Tencent(object): def __init__(self): self.he.
复制链接

扫一扫