正则表达式对网站分析来说尤为重要,尤其是Google Analytics中设置过滤器、高级细分以及自定义报告的时候,我们会经常用到正则表达式。

     正则表达式,是包含字符、数字和通配符的字符串。我们使用正则表达式就是为了查找符合某些规则的字符串,正则表达式就是描述这些规则的工具。如下图所示:高级细分中正则表达式的位置


     正则表达式到底是什么东西?举个例子,如果你想查找某个目录下的所有word文档时,你会在搜索框中输入:*.doc,这样你就能搜索到所有的word文档。注意,这个表达式中的*的含义是指任意的字符串,意思就是说*代表任意的内容,你会搜索到GA.doc、代码.doc等word文档。这个就叫做通配符,和通配符类似,正则表达式也是用来进行文本匹配的工具,不过它能更精确的描述你的需求。

     学习正则表达式,就需要先记住正则表达式的语法。下面列举几个常用的语法规则。

元字符描述用法
.匹配除“\n”外的任何单个字符例如:. 表示寻找任意一个字符
*匹配前面的子表达式零次或多次例如:ga*能匹配g、gaa、gaaa
+匹配前面的子表达式一次或多次例如:ga+能匹配ga、gaa、gaaa
?匹配前面的子表达式零次或一次 例如:g(a)?能匹配g、ga
$匹配输入字符串的结束位置例如:ga$能匹配最后为a的字符串
^匹配输入字符串的开始位置    例如:^ga能匹配开始为g的字符串


       学习理论知识之后,下面一起来看看在Google Analytics中如何应用正则表达式。
       例一:自定义报告中的正则表达式

     自定义报告中使用的正则表达式是:.*abc.com,主要的作用是筛选出能匹配abc.com的字符串

     例二:高级细分中的正则表达式


      高级细分中采用的正则表达式是:^数,主要的作用是匹配以“数”开头的网页标题的内容,点击“测试细分”得到的结果是333次访问。     

      正则表达式主要是为了方便筛选自己所需要的内容,所使用的表达式基本上是基于以上基本的语法进行变换。