python 爬虫 正则表达式爬取猫眼电影top100榜
思路分析,首先分析猫眼电影的top100榜的网页特点,然后根据网页信息编写用于匹配的正则表达式,然后提取对应的信息即可。
接下来是对存储文件的操作,将最终的结果存储在csv结果。因为在编写过程中,要试很多次,为了不要每次都手动删除文件,因此在程序运行开始之前判断文件是否已经存在,如果存在则删除,然后开始便开始爬取信息。代码如下:
import re
import requests
impo...
原创
2018-08-07 21:47:11 ·
478 阅读 ·
0 评论