正则表达式
心想才事成
这个作者很懒,什么都没留下…
展开
-
用正则表达式提取网页上表格的内容
用正则表达式提取网页上表格的内容 把提取到的内容转换成用逗号分隔的文本。 需要修改的就是第一行的 let rx = new Regex(@"(?]*?>)([\s\S]*?)(?=)",RegexOptions.IgnoreCase|||RegexOptions.Singleline);;let rxTR = new Regex(@"(?)([\s\S]*?原创 2012-05-03 14:38:13 · 12642 阅读 · 0 评论 -
取标题
取标题 let rxTit = new Regex(@"([^\b]+?)", RegexOptions.IgnoreCase ||| RegexOptions.Singleline) let title = rxTit.Match(stream).Groups.[1].Value 注意: 1、Grou原创 2012-11-29 17:13:15 · 729 阅读 · 0 评论 -
去掉多余的回车符
去掉多余的回车符 我们从 PDF 文件中,复制出来的文本,每一行都有一个回车符,这些回车符是多余的,不利于后续的再利用。因此,需要去掉。 手工一个个的删除,就显得力不人心了。这种事,正则表达式是最适合的了。 查找:([\w]+[^.:]?)\r\n 替换成:\1\1 后面要有一个空格原创 2013-01-13 17:00:59 · 997 阅读 · 0 评论 -
用 PowerShell 整理博客的目录
(原创 2014-09-04 21:55:05 · 987 阅读 · 0 评论 -
PowerShell 中的 replace
PowerShell 中的 replacePowerShell 中的 replace,既是是字符串函数,还是运算符,类似于 like、match 之类。比如,有一个字符串:$a = "aaa.bbb?ccc=ddd"要去掉问号后面的字符,可以用 repace 函数:$a.replace("?ccc=ddd", "")但是,replace 函数好像并不支持正则表达式,原创 2014-08-17 14:55:54 · 6041 阅读 · 0 评论 -
电子邮件地址的正则表达式
电子邮件地址的正则表达式^[a-zA-Z0-9._%+-]+@(?!.*\.\..*)[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}$原创 2014-11-23 14:14:00 · 11207 阅读 · 1 评论 -
整理从 PDF 转换成的 TXT
整理从 PDF 转换成的 TXT转换很慢,且有太多的回车。(\S| )\r \1 最后于.*?次; $\[ \S+ \] 于.*?\r原创 2014-12-08 15:38:49 · 771 阅读 · 0 评论 -
oracle 提取手机号码
oracle 提取手机号码select dh, regexp_replace(dh, '.*(1[[:digit:]]{10}).*','\1')from tablewhere regexp_like(dh, '.*(1[[:digit:]]{10}).*')原创 2017-01-19 20:29:27 · 2845 阅读 · 1 评论