我们在经过了获取网页的这一步操作之后,接下来就是对于数据的解析.我们需要先熟悉一下正则表达式的基本操作,这里提供教程入口,没有知识储备的同学可以先去这个通道看一下
大家可以只看最简单的"语法"一节
好,假设大家都已经基本熟悉了正则表达式地基本语法.那我们开始这一节的学习!
先上代码中的正则表达式代码:
#查找链接
findLink=re.compile(r'<a href="(.*?)">')
#查找图片
findImage=re.compile(r'<img.*src="(.*?)"',re.S)
#影片片名
findTitle=re.compile(r'<span class="title">(.*)</span>')
#影片评分
findRating