爬虫练习
在学爬虫,记录一下。
通信学生一枚
never say never !
展开
-
爬虫小小实战——豆瓣电影top250
这就是豆瓣电影top250的首页,本次小小实战就是将电影名、年代、评分以及评分人数存到csv文件中以便进行后续的数据分析。 一、基础 先贴代码及结果 import re import requests url="https://movie.douban.com/top250" #豆瓣top250的网址 headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, l...原创 2021-11-16 20:25:43 · 1015 阅读 · 2 评论 -
练习正则表达式之惰性匹配和贪婪匹配
.*称为贪婪匹配; .*?称为惰性匹配。 下面举例说明: 文本:玩会游戏吧,玩啥游戏?玩王者荣耀游戏。 1、表达式:玩会.*游戏 2、表达式:玩会.*?游戏 文本:<div>java</div><span>python</div> 1、表达式:<div>.*</div> 2、表达式:<div>.*?</div> 总结:惰性匹配就是寻找与目标最近的,就如第一个例子所示,文本..原创 2021-11-12 16:49:47 · 3101 阅读 · 0 评论 -
练习正则表达式之re模块
一、finditer import re it=re.finditer(r"\d+","我的电话是10086,我对象电话是10010") for i in it: print (i.group()) #这里finditer是python中的迭代器,利用group函数输出结果。\d+就是取数字的正则表达式 二、compile obj=re.compile("\d+") r=obj.finditer("我的电话是10000,我对象电话是10011") for it in r: ...原创 2021-11-15 08:57:37 · 1045 阅读 · 0 评论