概述
主要对文件夹(包括子文件夹)进行扫描得到所有文件夹名称及文件名称并保存到数据库中,提供文件夹或文件名的检索功能(包括单个关键词检索、多个关键词检索、全文匹配检索)
python中的正则表达式(re模块)
正则表达式本身是一种小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。
通配符 |
. |
匹配任意一个字符(除换行符) |
特殊字符转义 |
\ |
python\.org,为了获得re中的单个反斜线,需要使用两个反斜线 python\\.org |
原始字符串 |
r'..' |
r'python\.org' 如此不需要再使用两个反斜杠 |
字符集 |
[] |
匹配在一个范围内的单个字符'[abc]d'可以匹配ad,bd,cd '[a-z]d'可以匹配a-z26个字母中的任意一个 '[a-zA-Z0-9]'可以匹配大小写字母和数字的一个 |
反转字符集 |
^ |
'[^abc]'匹配除了abc |