文章目录 基本信息 描述 使用的包/工具/技术 问题与对应处理 IP访问频率 User-Agent限制 分析 翻页参数 如何通过Re解析 基本信息 今天,手把手教你入门 Python 爬虫,爬取猫眼电影 TOP100 榜信息。 猫眼电影的网址为:http://maoyan.com/,但这不是我们此次想爬取的站点,我们爬取的站点是这个:http://maoyan.com/board/4(TOP100榜单) 前100的电影的信息爬下来,保存起来。 下面是爬取结果 描述 静态网页,非常简单 。通过观察我们需要爬取的内容有:片名,图片,排名,主演,上映时间和评分这6部分。