最近在做关于因果事件的模式扩充,如果语料文件比较小,本人喜欢用Notepad++查看。如果是单个字或短语查找的,都是CTRL+F就能查找相关记录了。但是因果关系中有配套式,比如这句话“因为之前有玩滑板所以选择了单板”,“因为,所以”这种配套式出现在同个句子中,该怎么查找出来呢?这种情况就可以利用Notepad++中的正则查找功能,如图1中的左下角红框选择正则匹配,在输入框输入因为.*所以.*。其中.*代表可以有多个字符,最终查找时,你就会发现因为后边的内容以及所以后面的内容都会用不同于原文的颜色显示出来了,如图2所示。请忽略我语料中的/标记,
哈哈哈,因为我的语料都已经词性标注好了。