python爬取豆瓣电影 Top 250里的内容

最新推荐文章于 2021-06-29 14:44:34 发布

naonao77

最新推荐文章于 2021-06-29 14:44:34 发布

阅读量482

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/naonao77/article/details/88081640

版权

1.开始分析页面，找到所抓取的文字所在标签，如图所示。
在这里插入图片描述
2.通过requests.get获取整个页面代码，并通过正则表达式匹配出所需字符。
关于正则表达式 https://www.cnblogs.com/chuxiuhong/p/5885073.html
经过分析匹配出电影名称，导演等的正则为
'<span class="title">(.*?)</span>.*?<p class="">(.*?)</p>'
整体代码如下
在这里插入图片描述
打印结果如下

后续应该继续完善，精简信息，将信息存入文件，第一次学正则，好蒙好蒙～

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。