Regex
文章平均质量分 73
geekcoder
Android
展开
-
C#实现web信息自动抓取
C#实现web信息自动抓取背景随着Internet的普及,网络信息正以极高的速度增长,在这么多数据中找到自己需要的信息是一件很繁琐的事情,找到需要的信息后如何获取也是件麻烦的事。这就需要Internet信息抓取程序来代替人工的操作。所谓Internet信息抓取程序,就是程序会按照用户的关键词或关键网站来收集相应的信息,并提供给用户想要的信息格式。信息量的增加会带来信息网站发布人员工原创 2013-02-28 17:16:16 · 624 阅读 · 0 评论 -
.NET正则匹配模式
1 概述匹配模式指的是一些可以改变正则表达式匹配行为的选项或修饰符。不同的语言支持的匹配模式不同,使用的方式也不同。一般可分为全局和内联两种。下面主要介绍.NET中的匹配模式,其它语言的匹配模式,后续视情况补充。2 匹配模式2.1 全局匹配模式和内联匹配模式概述.NET中的全局匹配模式是通过RegexOptions 枚举值指定的,可以按位“或原创 2013-03-22 10:19:41 · 1333 阅读 · 0 评论 -
.NET 正则表达式 平衡组
Matching Balanced Constructs with .NET Regular ExpressionsBrief Computer Science Theory BackgroundIn computer science a formal language is a set of finite character strings that are created by翻译 2013-02-28 10:19:59 · 944 阅读 · 0 评论 -
Regex之平衡组例子
正则表达式之平衡组 关于正则表达式的平衡组的内容,请参看.NET正则基础之——平衡组如果你不想了解平衡组的具体用法,这里,我们直接应用其一个结果表达式即可.问题:有时候我们要匹配类似如下的内容[sin(x)+78*[cos(45)/7]+36]-78*9+[45*(26*3/sin(x))]匹配要求的结果是1、[sin(x)+78*[cos(45)/7]+36原创 2013-02-28 12:48:27 · 1238 阅读 · 0 评论 -
UltraEdit正则表达式使用
1. UE里面替换tab键为空格 解决使用UE编辑好且排列整齐的文件在EditPlus中错位的问题。 对于已有的带有tab键的空格,若需要将tab键转换为空格,可使用如下方法: 1)使用查找替换功能(Ctrl+R),^t 表示tab,在出现的窗口中的“查找(N)”输入:^t ,“替换为(P)”输入四个空格,全部替换即可。 2)中文是 工具栏“格式”-原创 2013-02-28 10:23:49 · 1853 阅读 · 0 评论 -
UltraEdit正则技巧
以下是网上摘录的UE 技巧1)删除空行: 替换 %[ ^t]++^p 为 空串 2)删除行尾空格: 替换 [ ^t]+$ 为 空串 3)删除行首空格: 替换 %[ ^t]+ 为 空串4)每行设置为固定的4个空格开头: 替换 %[ ^t]++^([~ ^t^p]^) 为 " ^1" 5)每段设置为固定的4个空格开头: 替换 %[ ^t]+ 为 " " (如果一行是以空格开始的,则原创 2013-03-18 10:26:20 · 1043 阅读 · 0 评论 -
Spider-正则网络爬虫
在开发项目的过程,很多情况下我们需要利用互联网上的一些数据,在这种情况下,我们可能要写一个爬虫来爬我们所需要的数据。一般情况下都是利用正则表达式来匹配Html,获取我们所需要的数据。一般情况下分以下三步:1、获取网页的html2、利用正则表达式,获取我们所需要的数据3、分析,使用获取到的数据,(例如,保存到数据库) 接下来我们分析代码:1、获取网页的html 对于一些原创 2013-07-08 15:04:08 · 1296 阅读 · 0 评论 -
Regex-Coding: UTF-8 汉字
1 # -*- coding: utf-8 -*- 2 """ 3 config.py 4 5 Created by Manabu Terada, CMScom on 2009-08-08. 6 """ 7 import re 8 9 STOP_WORD = [] 10 11 ## Setting, adding原创 2013-04-26 11:15:34 · 1711 阅读 · 0 评论 -
Regex-后向引用
使用小括号指定一个子表达式后,匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下,每个分组会自动拥有一个组号,规则是: 从左向右,以分组的左括号为标志,第一个出现的分组的组号为1,第二个为2,以此类推。后向引用用于重复搜索前面某个分组匹配的文本。例如: \1:代表分组1匹配的文本。难以理解?请看示例:\b(\w+)\b原创 2013-03-25 15:01:05 · 1712 阅读 · 0 评论 -
Regex-内部引擎
不懂正则引擎原理的情况下,同样可以写出满足需求的正则,但是不知道原理,却很难写出高效且没有隐患的正则。所以对于经常使用正则,或是有兴趣深入学习正则的人,还是有必要了解一下正则引擎的匹配原理的。 1 为什么要了解引擎匹配原理一个个音符杂乱无章的组合在一起,弹奏出的或许就是噪音,同样的音符经过作曲家的手,就可以谱出非常动听的乐曲,一个演奏者同样可以照着乐谱奏出动听的乐曲,但他/她或原创 2013-03-22 10:07:39 · 828 阅读 · 0 评论 -
Regex匹配指定目录下面的任意文件小例子
匹配指定目录下面的任意文件1\/(js|css|images|uploads|userprofile)(\/[a-zA-Z0-9\D]+)+\.([a-z0-9]+)?原创 2013-03-01 10:24:31 · 821 阅读 · 0 评论 -
C#正则表达式匹配相关字符串
#正则表达式匹配字符串的方法如下: 1.使用C#中使用正则表达式System.Text.RegularExpressions命名空间; 2.使用C#中使用正则表达式Matches()方法匹配字符串,格式如下:MatchCollection Matches = Regex.Matches(Str, Pattern, RegexOptions.IgnoreCas原创 2013-03-01 08:42:41 · 2200 阅读 · 0 评论 -
Regex平衡组/递归匹配
平衡组/递归匹配这里介绍的平衡组语法是由.Net Framework支持的;其它语言/库不一定支持这种功能,或者支持此功能但需要使用不同的语法。有时我们需要匹配像( 100 * ( 50 + 15 ) )这样的可嵌套的层次性结构,这时简单地使用\(.+\)则只会匹配到最左边的左括号和最右边的右括号之间的内容(这里我们讨论的是贪婪模式,懒惰模式也有下面的问题)。假如原来的字符串里的左原创 2013-02-28 10:58:35 · 2051 阅读 · 0 评论 -
Javascript中正则表达式
javascript 正则表达式-贪婪模式与懒惰模式http://buzheng.org/blog/regex-possessive-quantifiers-reluctant-quantifiers/前段时间对自己以前了解的正则表达式的基础知识做了一个总结,有了基础知识已经能够能应付大多数情况,像字符串匹配、正则替换、校验等;但是再使用的过程中你可能发现一个问题,就是当使用重复元原创 2013-02-27 12:25:38 · 1272 阅读 · 0 评论 -
Android 正则表达式
在Sun的Java JDK 1.40版本中,Java自带了支持正则表达式的包,本文就抛砖引玉地介绍了如何使用java.util.regex包。 可粗略估计一下,除了偶尔用Linux的外,其他Linu x用户都会遇到正则表达式。正则表达式是个极端强大工具,而且在字符串模式-匹配和字符串模式-替换方面富有弹性。在Unix世界里,正则表达式几乎没有什么限制,可肯定的是,它应用非常之原创 2014-03-25 14:21:10 · 2002 阅读 · 0 评论