python爬虫获取js动态资源

最新推荐文章于 2024-06-25 13:36:02 发布

到你了,弟弟

最新推荐文章于 2024-06-25 13:36:02 发布

阅读量9.2k

点赞数 1

分类专栏：爬虫

本文链接：https://blog.csdn.net/qq_37977267/article/details/83177456

版权

# coding:utf-8
# 电视猫网址:https://www.tvmao.com/program
import requests
from lxml import etree
from selenium import webdriver

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                         'Chrome/69.0.3497.100 Safari/537.36',
           'Referer': 'https://www.tvmao.com/'}
url_list = ['https://www.tvmao.com/program/duration/cctv/w{}.html',
            'https://www.tvmao.com/program/duration/satellite/w{}.html']
# 央视和卫视
for url_program in url_list:
    # 星期一到星期日
    for i in range(1, 8):
        url = url_program.format(i)
        html = requests.get(url, headers=headers).text
        html = etree.HTML(html)
        td = html.xpath('//td[@class="tdchn"]')
        # 电视台
        for j in td:
            href = 'https://www.tvmao.com'+j.xpath('./a/@href')[0]
            name_tv

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

到你了,弟弟

关注关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
python爬虫获取js动态资源

# coding:utf-8# 电视猫网址:https://www.tvmao.com/programimport requestsfrom lxml import etreefrom selenium import webdriverheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebK...
复制链接

扫一扫