初次用python写一个简单爬虫-获取电影网站电影列表

最新推荐文章于 2024-09-12 03:45:44 发布

MarvinMao

最新推荐文章于 2024-09-12 03:45:44 发布

阅读量1.3k

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/marvinmao/article/details/104932344

版权

本文介绍了一个Python初学者如何编写简单的爬虫，目标是从电影网站抓取电影列表信息。通过学习网络请求和解析HTML，实现数据的自动化获取，为入门Python爬虫提供基础教程。

摘要由CSDN通过智能技术生成

import re
from urllib import request
import time
# 电影天堂电影列表页，{}里面是页码，一共有200多页
url = 'https://www.dytt8.net/html/gndy/dyzz/list_23_{}.html'  
# 正则表达式，标题名称带有其他信息，《》中间的是想要获取的电影名称
name_pattern = 'class="ulink">([\w\W].*?)《([\w\W].*?)》([\w\W].*?)</a>'
# 给个空列表，用来存电影名称
movies = []
starttime = time.time<