以前介绍过特殊字符,但是没有说具体操作,只是在最后装逼的说了句“无非类似于[^x00-x7f]”的话,显得属于基本操作,可以在眨眼功夫搞定。
这几天来了兴趣,实属折腾了一番,不过最后也算是成功实现了。
“换句话说,我们项目里的所有数据都只能是由这128个字符组成,不能由任何其他的。老帅儿:临床试验数据中的特殊字符是个啥zhuanlan.zhihu.com
那么现在就简单了,只剩下怎么查的问题——交给Programmer。
基本上用很简单的语句就搞定,无非类似于[^x00-x7f]。不同的语言有不同的语法,正则表达式更是大同小异。”
举例来说,现有数据情况如下。
可以看到一共有四个变量,在"term1"列下面有我们说的特殊字符,比如汉字,罗马数字以及“kkk(TCM)"里的中文括号。
现在需要将这些都找出来,并放在另外一列。
实现效果如下。
从上面可以看到有个函数“InvalidC",这个函数是自定义的。具体步骤如下:
- 写代码,如下。
Function InvalidC(x)
Dim brr
Dim regx As Object
Set regx = CreateObject("vbscript.regexp")
Dim str As String
str = x.Value
Dim item
With regx
.Global = True
.Pattern = "[^x00-x7f]"
Set matc = .Execute(str)
ReDim brr(matc.Count - 1)
For Each item In matc
i = i + 1
brr(i - 1) = item
Next
End With
InvalidC = Join(brr, ",")
End Function
2. 调出Excel里"开发(Developer)":文件-->选项-->自定义功能区-->开发工具-->勾选确定。已经调出来的忽略。
3. 新建一个"模块(Module)",贴上代码,保存,关闭即可。
4. 回到Excel界面使用函数,不过需要在公式-->插入函数-->用户定义里面去找到自己定义的函数,完成操作。
最后,再强调一下找到的特殊字符会包含哪些,也就是这个函数会把哪些字符当作特殊字符?哪些当作正常字符?
还是上图,下面蓝色框着的128个字符会视为正常字符,其他的则视为特殊字符。
细心一点会发现,十六进制列里,其实就是代码里"x00-x7F"的来源,也就是代表0-127这128个字符。