正则表达式对网站分析来说尤为重要,尤其是Google Analytics中设置过滤器、高级细分以及自定义报告的时候,我们会经常用到正则表达式。
正则表达式,是包含字符、数字和通配符的字符串。我们使用正则表达式就是为了查找符合某些规则的字符串,正则表达式就是描述这些规则的工具。如下图所示:高级细分中正则表达式的位置
正则表达式到底是什么东西?举个例子,如果你想查找某个目录下的所有word文档时,你会在搜索框中输入:*.doc,这样你就能搜索到所有的word文档。注意,这个表达式中的*的含义是指任意的字符串,意思就是说*代表任意的内容,你会搜索到GA.doc、代码.doc等word文档。这个就叫做通配符,和通配符类似,正则表达式也是用来进行文本匹配的工具,不过它能更精确的描述你的需求。
学习正则表达式,就需要先记住正则表达式的语法。下面列举几个常用的语法规则。
元字符 | 描述 | 用法 |
. | 匹配除“\n”外的任何单个字符 | 例如:. 表示寻找任意一个字符 |
* | 匹配前面的子表达式零次或多次 | 例如:ga*能匹配g、gaa、gaaa |
+ | 匹配前面的子表达式一次或多次 | 例如:ga+能匹配ga、gaa、gaaa |
? | 匹配前面的子表达式零次或一次 | 例如:g(a)?能匹配g、ga |
$ | 匹配输入字符串的结束位置 | 例如:ga$能匹配最后为a的字符串 |
^ | 匹配输入字符串的开始位置 | 例如:^ga能匹配开始为g的字符串 |
学习理论知识之后,下面一起来看看在Google Analytics中如何应用正则表达式。
例一:自定义报告中的正则表达式
自定义报告中使用的正则表达式是:.*abc.com,主要的作用是筛选出能匹配abc.com的字符串
例二:高级细分中的正则表达式
高级细分中采用的正则表达式是:^数,主要的作用是匹配以“数”开头的网页标题的内容,点击“测试细分”得到的结果是333次访问。
正则表达式主要是为了方便筛选自己所需要的内容,所使用的表达式基本上是基于以上基本的语法进行变换。
转载于:https://blog.51cto.com/himomo/958450