提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
正则篇
前言
记录自己的学习经历
一、对正则的认识和使用
我觉得正则就是可以通过一种匹配的方式来找到自己想要获得的内容
二、使用步骤
1.引入库
代码如下(示例):
import re
2.读入数据
代码如下(示例):
name=re.compile(r'<span class="title">(.*)</span>')#正则表达式 #compile表示规则,在用findall找
list1=re.findall(name,item)[0].strip()#有多个名字 用第一个,strip去掉左右的空格
data1.append(list1)#电影名字
actor=re.compile(r'<p class="">(.*?)</p>',re.S)#正则表达式,re.S去掉换行符(让换行符包含在需要替换的正则中)
list2=re.findall(actor,item)[0].strip()
list2=re.sub('<br/>','',list2)
list2 = re.sub('\n', '', list2)
list2=re.sub('... ','/',list2)
list2=re.sub('\xa0','',list2)
data1.append(list2)#导演和演员
people = re.compile(r'<span>(.*?)评价</span>') # 正则表达式,评价人数
list4 = re.findall(people, item)
data1.append(list4)
该处使用的是用re来定义查询规则以及re.sub的使用方法。
总结
关于对正则的使用目前还没了解太多,只是通过一些代码来了解部分正则的用法。(第一次发csdn
!)