爬取猫眼电影信息（电影名称，电影主演）

最新推荐文章于 2023-07-07 18:05:46 发布

Starry__.

最新推荐文章于 2023-07-07 18:05:46 发布

阅读量722

点赞数

文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_63890705/article/details/122293447

版权

今天就用我们的xpath解析方式解析

内容很简单

代码如下：

import requests
from lxml import etree

'''
url = 'https://www.maoyan.com/board/4'
'''
for page in range(10):
    url = f'https://www.maoyan.com/board/4?offset={page*10}'
    headers = {
       'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.55 Safari/537.36 Edg/96.0.1054.43'
    }
    resopnse = requests.get(url, headers=headers, timeout=2)
    result = resopnse.text
    #解析数据
    element = etree.HTML(result)
    movie_name = element.xpath('//p[@class="name"]/a/@title')
    # print(movie_name)
    movie_people = element.xpath('//p[@class="star"]/text()')
    # print(movie_people)
    movie_time = element.xpath('//p[@class="releasetime"]/text()')
    # print(movie_time)
    for movie_name,movie_people in zip(movie_name, movie_people):
        print(movie_name)
        print(movie_people)

        data = f'{movie_name}   {movie_people}'
        #保存数据
        with open('猫眼.txt', 'a',)as f:
            f.write(data + '\n')

优惠劵

Starry__.

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
爬取猫眼电影信息（电影名称，电影主演）

今天就用我们的xpath解析方式解析内容很简单代码如下：import requestsfrom lxml import etree'''url = 'https://www.maoyan.com/board/4''''for page in range(10): url = f'https://www.maoyan.com/board/4?offset={page*10}' headers = { 'User-Agent': 'Mozilla/5.0
复制链接

扫一扫