大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
本文主要介绍了两万文字详解Python正则表达式(语法、验证方法、使用案例、练习题、常见错误),希望能对学习Python的同学们有所帮助。
1. 正则表达式的定义和应用
正则表达式定义了字符串搜索或者匹配的模式。通常该模式会使用在字符串的查找或者查找并替换的操作。该概念产生于1950年左右,是由美国数学家Stephen Cole Kleene发明的。该概念已广泛应用于Unix文本处理程序。 自1980年以来,正则表达式的语法主要分为两种,一种是POSIX标准,另一种是更为常用的Perl语法。
正则表达式的应用可谓无处不在。常用于搜索引擎、文本编辑器(比如我最常用的Sublime Text3)中的搜索和替换对话框、Linux文本处理命令(如sed、awk等)以及各种编程语言中。编程语言通过内置库或者第三库的方式来提供正则表达式的功能。虽然正则表达式的效率不如编程语言中内置库中的find、replace等函数,但它的功能真的是无与伦比。
作为一个NLP从业者,经常会直接在文本编辑器中使用正则表达式进行文本预处理。如果文本内容不多(