python爬取豆瓣电影 Top 250里的内容

1.开始分析页面,找到所抓取的文字所在标签,如图所示。
在这里插入图片描述
2.通过requests.get获取整个页面代码,并通过正则表达式匹配出所需字符。
关于正则表达式 https://www.cnblogs.com/chuxiuhong/p/5885073.html
经过分析匹配出电影名称,导演等的正则为
'<span class="title">(.*?)</span>.*?<p class="">(.*?)</p>'
整体代码如下
在这里插入图片描述
打印结果如下
在这里插入图片描述
后续应该继续完善,精简信息,将信息存入文件,第一次学正则,好蒙好蒙~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值