python3-10.爬虫-猫眼电影榜单

最新推荐文章于 2022-11-18 08:49:21 发布

want you tell me why

最新推荐文章于 2022-11-18 08:49:21 发布

阅读量232

点赞数

分类专栏： python笔记文章标签：爬虫 python

本文链接：https://blog.csdn.net/weixin_42655231/article/details/104293405

版权

python笔记专栏收录该内容

14 篇文章 1 订阅

订阅专栏

import urllib
from urllib import request
import re

def main():
    headers = {'User-Agent':'Mozilla/5.0 3578.98 Safari/537.36'}
    url = urllib.request.Request("https://maoyan.com/board/4",headers=headers)
    content = urllib.request.urlopen(url,timeout=15).read().decode('utf-8')

    pattern = re.compile('<dd>.*?board-index.*?>(\d+)</i>.*?src="(.*?)".*?name"><a'
                         +'.*?>(.*?)</a>.*?star">(.*?)</p>.*?releasetime">(.*?)</p>'
                         +'.*?integer">(.*?)</i>.*?fraction">(.*?)</i>.*?</dd>', re.S)
 #.*任意数量的不换行的字符 ？重复0次或者n次  \d+匹配1个或更多连续的数字
    items = re.findall(pattern, content)
    list = []
    for item in items:
        dict={}
        dict = {"排名":item[0],"名称":item[2],"主演:":item[3].strip()[3:],"上映时间:":item[4].strip()[5:],"豆瓣评分:":item[5] + item[6]}
        list.append(dict)
    print(list)
        
if __name__ == '__main__':
    print("猫眼电影排名榜单")
    main()

结果：

优惠劵

want you tell me why

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3-10.爬虫-猫眼电影榜单

import urllibfrom urllib import requestimport redef main(): headers = {'User-Agent':'Mozilla/5.0 3578.98 Safari/537.36'} url = urllib.request.Request("https://maoyan.com/board/4",headers=...
复制链接

扫一扫