初次用python写一个简单爬虫-获取电影网站电影列表

本文介绍了一个Python初学者如何编写简单的爬虫,目标是从电影网站抓取电影列表信息。通过学习网络请求和解析HTML,实现数据的自动化获取,为入门Python爬虫提供基础教程。
摘要由CSDN通过智能技术生成
import re
from urllib import request
import time
# 电影天堂电影列表页,{}里面是页码,一共有200多页
url = 'https://www.dytt8.net/html/gndy/dyzz/list_23_{}.html'  
# 正则表达式,标题名称带有其他信息,《》中间的是想要获取的电影名称
name_pattern = 'class="ulink">([\w\W].*?)《([\w\W].*?)》([\w\W].*?)</a>'
# 给个空列表,用来存电影名称
movies = []
starttime = time.time<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值