松鼠
2018/7/23
从今天起开始正则表达式的学习,凭此系列博客作为读书笔记和心得记录,一些思考和想法也会笔耕于此。
第一章:正则表达式入门(Introduction to regex)
首先需要理解这玩意是干啥的,为啥我们要学这玩意。学编程是避不开字符串的各种杂七杂八的处理的,说到底程序还是字符串堆砌,无论是搞爬虫是我们需要定向检索某一类的资源,或是数据库对各种信息的处理,亦或是最单纯的提取我们需要的各类文字、数字,我们总是希望使用某种方式直接获得我们想要的东西,跟其他方法比起来,正则有得天独厚的优势,具体细节暂且不表。
-
正则语句组成结构
完整的正则表达式由元字符(metacharacters)和普通文本字符(normal text characters)组成,简单来说,元字符就是语法功能,普通文本字符就是文本,元字符对文本的操作控制是以一个单元(unit)为基础的,元字符会对整个