import re
from urllib import request
import time
# 电影天堂电影列表页,{}里面是页码,一共有200多页
url = 'https://www.dytt8.net/html/gndy/dyzz/list_23_{}.html'
# 正则表达式,标题名称带有其他信息,《》中间的是想要获取的电影名称
name_pattern = 'class="ulink">([\w\W].*?)《([\w\W].*?)》([\w\W].*?)</a>'
# 给个空列表,用来存电影名称
movies = []
starttime = time.time<
初次用python写一个简单爬虫-获取电影网站电影列表
最新推荐文章于 2024-09-12 03:45:44 发布
本文介绍了一个Python初学者如何编写简单的爬虫,目标是从电影网站抓取电影列表信息。通过学习网络请求和解析HTML,实现数据的自动化获取,为入门Python爬虫提供基础教程。
摘要由CSDN通过智能技术生成