正则表达式
引入模块:import re
re.findall :第三个参数:re.I 匹配不需要大小写 参数之间用 | 分隔
re.match:从字符串的首字母开始匹配 一旦匹配到就会停止
re.search:搜索整个字符串 一旦匹配到就会停止
匹配数字:\d 匹配字母:\D 反向匹配: ^ (ctrl+6) 匹配字母加数字: \w(等同于[A-Za-z0-9_])
匹配类似&非单词字符(包括空格 、\n、\t) : \W 匹配空白字符: \s
匹配除换行符\n之外其他所有字符: . (点符号)
数量词(多次重复的匹配): {数字,数字} 例子:[a-z]{3,8}
* 号 匹配0次或者无限多次 + 号 匹配1次或者无限多次 ? 号 匹配0次或者1次
贪婪 于 非贪婪 python倾向于贪婪模式的匹配 改变为非贪婪模式符号:?(前边需要加上数量词范围 类似{3,8}?)
边界符:^从字符串的开始匹配 $从字符串的末尾开始匹配 例子:'^\d{4,8}$'
组:将要匹配的字符用括号扩起来 例子:'(python){3}' 括号内的为且关系
re.sub 函数:字符串替换 第四个参数:count=0(匹配后所能被替换最大的次数) 简化版:replace
第二个参数 可以传一个函数
group分组:适用于re.search
JSON——一种轻量级的数据交换格式,表现形式--字符串
优势:易于阅读 易于解析 网络传输效率高 跨语言交换数据
反序列化:json.loads 序列化 : json.dumps