爬取猫眼电影排行榜前100部电影
认为有用的话请点赞,码字不易,谢谢。
其他爬虫实战请查看:https://blog.csdn.net/qq_42754919/category_10354544.html
网站地址https://maoyan.com/board/4?offset=
本方法主要只用requests库对网站信息抓取。
1.抓取首页
我们将网址URL使用requests打开,获取HTML文本代码,输入自己电脑中的浏览器的代理headers。使用status_code是否等于200判断网站是否打开。最后返回html文本.
def gethtml(url):
headers={
'User-Agent':