UE 正则表达式

UltraEdit是一套功能强大的文本编辑器,可以编辑文字、Hex、ASCII码,可以取代记事本,内建英文单词检查、C++及VB 语法加亮,可同时编辑多个文件,而且即使开启很大的文件速度也不会慢。软件附有 HTML Tag 颜色显示、搜寻替换以及无限制的还原功能。UltraEdit支持二进制和16进制编辑,所以还可以用来修改EXE 或DLL 文件。

本文面向有一定UltraEdit使用经验的用户,介绍UltraEdit中的高级功能,这些功能往往被大多数使用者忽视,灵活地使用这些功能将极大的提高工作效率,达到事半功倍的效果。要使用本教程所介绍的所有功能,需要UltraEdit 12.00以上版本或UEStudio 06.10以上版本。

列模式

列模式是讲到UltraEdit不得不说的一个强大功能。列模式能让您按列选取和编辑数据,而一般编辑器只能按行选择数据。

进入列模式的方法:

使用快捷键Alt+C,或者使用菜单 列->列模式,见下图

进入列模式后,通过按下键盘上的SHIFT键和方向键来选择多列,选中后的效果见下图,光标变成了多列光标。

此时在键盘上敲入字符的时候,被选中的每一列都会出现相同的字符,比如按下键盘上的”/”两次,效果见下图。这个例子实际上在编程的时候经常用到,当需要注释一段代码的时候,不必一行一行的注释,采用列模式能减少很多重复的工作。

插入/填充列:

以下图的书目文件为例,文件中缺少出版社的信息,而这些书的出版社都为”电子工业”,使用插入/填充列可以方便地完成这个工作。

首先在列模式下选择要填充的列,选择菜单 列->插入/填充列,然后出现一个对话框,在这里填写要插入的文字后点”确定”。

确定后,刚才选中的每一列上都出现了”电子工业”四个字。

在这里也许您会问,为什么不用上面的方法,选中多列后直接在键盘上敲入”电子工业”四个字?其实如果敲入的是英文字母或字符是没有问题,当在列模式下敲入的是汉字的时候会出现乱码,因此可以用插入/填充列这个功能来解决这个问题。

讲到这里是否已感觉到UltraEdit的强大,接着往下看,您会发现UltraEdit能做很多Excel的工作,甚至Excel完成不了的工作。

插入号码:

同样以上面的书目文件为列,我们希望给每行前面加一个行号。

首先进入列模式,选中第一列,也就是”书名 = “这几个字前的那一列,选择菜单 列->插入号码。如下图:

点击后进入以下插入号码的选项框,我们要插入的是行号,因此起始数字为1,增量也是1,为了显示得整齐一些我们把列首补零也勾上。

按上图的设置设好后,点”确定”,效果见下图,插入行号的工作就完成了。

上面说了UltraEdit能完成很多Excel的工作,下面就看看如何按列求和。

/选择统计:

在上面书目文件中,有一个价格列标名了每本书的价格,若想知道这些书的总价钱,很简单:

首先在列模式下选中这些价格,然后点菜单 列-> 列/选择统计

在出现的对话框中点一下统计,即可看到统计结果,见下图。这个对话框中的”忽略数据中的字符”填的是”,”,这是保证您要统计的数据以千分位分隔的时候也能正常统计,比如这样的数字 “24,501″。

或许您有一个疑问,上面我们处理的文件,它的格式都很工整,但往往我们拿到的初始数据都是不工整的。遇上下图的数据,我们想统计这些书的总价钱的时候怎么办?(第3个字段表示价格)下面介绍转换到固定列功能来解决这个问题。

转换到固定列:

通过菜单 列->转换到固定列  将弹出以下对话框,根据文件的情况设置分隔字符,本例中我们的分隔符是TAB制表符,输入”^t”,其它设置保持默认值,然后点”扫描”按钮,扫描后的结 果显示在最下面的框中,本例中为”10,27,3,8″,表示第一个字段(序号)要占10列,第二个字段(书名)占27列,以此类推。

通常我们不需要改变扫描后的结果,直接点转换就能得到下图的效果,这样无论是做统计,还是做接下来讲到的排序,都很方便。

排序(Sort)

排序是UltraEdit提供的非常实用的一个功能,也许您会觉得用Excel更方便,但别忘了Excel只能支持65535行数据,而UltraEdit处理上百万行的数据也不成问题,功能决不逊色于Excel。

下面用一个简单的文件为例,讲述如何排序,见下图,这个是一个商品表,最后一列是价格,我们要以价格来排序文件。

首先进入菜单 文件->排序->高级排序/选项,见下图

弹出如下的排序选项对话框:

排列顺序:可以选择是升序还是降序

删除重复项:可以将文件中一模一样的行删除,只保留一行。(想想用Excel怎么去除重复项)

数字排序:当要排序的列是数字,并且关心它的实际大小时需要勾选这一项,下面的示例将说明这个问题。

排序列:一共可以设置4个列,通过起始列和结束列来指定。

假设我们要把这个文件按价格升序排列,在这个对话框中选择升序,因为我们关心数值的实际大小,所以勾选数字排序,通过标尺我们确定价格这一字段从65列起到71列结束。设置好后点”排序”按钮,效果如下图。(如果您看不到标尺,可能通过菜单 视图->显示标尺 来显示)

如果没有勾选数字排序,将会出现下图所示的结果,可以看出它是按字符的ASCII码在大小来排序的,而不是数值的真正大小。

正则表达式搜索与替换

先来解释一下什么叫正则表达式:相信您一定使用过Windows或Dos下用于文件查找的通配符,也就是*和?。如果您想查找某个目录下的所有的Word文档的话,您很自然地会搜索”*.doc”。在这里,”*”会被解释成任意的字符串。和通配符类似,正则表达式也是用来进行文本匹配的工具,只不 过比起通配符,它能更精确地描述您的需求。当然,代价就是更复杂,例如搜索doc为扩名的文件,正则表达式为”.*\.doc”。别看它复杂了很多,但正 则表达式几乎能满足您的一切搜索需求。比如您可以编写一个正则表达式,用来查找所有以0开头,后面跟着2-3个数字,然后是一个连字号”-”,最后是7或8位数字的字符串(像010-12345678或0376-7654321)。

UltraEdit中,正则表达式被很好地支持,目前的版本中一共支持三种,UltraEdit风格正则表达式、Unix风格正则表达式和Perl兼容正则表达式,本文介绍Perl兼容正则表达式,这是一条被广泛使用的正则表达式,绝大多数的编程语言都支持这种表达式。

要使用Perl兼容正则表达式,需要在UltraEdit中做一下设置。点击菜单 高级->配置,出现下图的对话框,在左侧选中”正则表达式引擎”,右边勾选”Perl兼容正则表达式”。

正则表达式语法:

由于本文的重点不在正则表达式语法方面,这里只做简单介绍。

元字符:

元字符说明
.匹配除换行符以外的任意字符
\w匹配字母或数字或下划线或汉字
\s匹配任意的空白符()
\d匹配数字
\b匹配单词的开始或结束
\W匹配任意不是字母,数字,下划线,汉字的字符
\S匹配任意不是空白符的字符
\D匹配任意非数字的字符
\B匹配不是单词开头或结束的位置
^匹配行首
$匹配行尾

字符转义

如果您想查找元字符本身的话,需要使用”\”来转意。例如”.”代表除换行以外的任意字符,如果您想搜索”.”这个字符的话,需要这样使用”\.”。

重复

语法说明
*重复零次或更多次
+重复一次或更多次
?重复零次或一次
{n}重复n次
{n,}重复n次或更多次
{n,m}重复n到m次

字符集

若要匹配aeiou五个字符中的任意一个,可以表示成[aeiou]。再如[0-9]表示0到9之间的任意一个数字,它的含义和元字符中的\d实际上是一样的。

反意

如果要匹配非a则[^a],除aeiou五个字母之外的表示成[^aeiou],

贪婪与止贪

设有字符串dveadebcadefboipi,正则表达式a.*b,表达式的意思是匹配由a开始中间包含任意多个字符并以b结尾,这个表达式匹配出来的结果是adebcadefb,而不会是adeb,我们称这种匹配为贪婪匹配,因为它匹配了尽可能多的字符。要防止这种贪婪匹配,使用”?”,把上面的表达式写成a.*?b的话,匹配出来的结果就是adeb了。

UltraEdit中的正则表达式查找

我们以一个html为例,希望搜索一个<ul> Html标记的内容。首先要明确要搜索的字符串的特征:以<ul开头ul>结尾,中间包含任意字符(包括换行),于是表达式可以写 成<ul[\S\s]*?ul>。在这里[\S\s]表示空白和非空白(即所有字符),随后的*表示任意多个,?表示非贪婪搜索。

确定表达式后按下键盘上的Ctrl+F在弹出的查找对话框中输入表达式,并且勾选”正则表达式”,点”查找下一个”即可看到搜索的效果见下图。

UltraEdit中的正则表达式替换

UltraEdit中正则表达式不但可以用于查询还能用于替换,这里介绍一种复杂的替换。以下图所示的一个文件为例,文中有很多日期,都是这样的格式dd/mm/yyyy,我们希望把他替换成yyyy-mm-dd的格式。

既然是替换,那么必需先查到目标串,用\d表示数据,月和日都一位或两位数据组成,正则表达式表示为\d{1,2},年份都四个数字表示为\d{4},加上中间的分隔符/,整个日期串可以表示为\d{1,2}/\d{1,2}/\d{4}。我们替换的目标是要把最后的年份放到第一位去,因此 还需要这个搜索能返回各个部分的值,在Perl正则表达式中用()可以返回搜索串中的值,并用$1表示第一个括号中的值,因此我们加上3个括号表达式变成(\d{1,2})/(\d{1,2})/(\d{4}),那么$1表于日,$2表示月,$3表示年。说到这里要达到我们的目标就很简单了。

按下键盘上的Ctrl+R调出替换对话框,查找内容为(\d{1,2})/(\d{1,2})/(\d{4}),替换为$3-$2-$1,记得勾上”正则表达式”。

填好后”全部替换”,替换后的效果见下图。

常用的正则表达

行首空格: ^\s+

行尾空格:\s+$

IP地址:[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}

正整数: ^[1-9]\d*$

负整数: ^-[1-9]\d*$

远程文件直接编辑

对于刚接触Linux的人来说,要编辑Linux上的文件是一件很痛苦的使用,Linux上的VI编辑器可不像UltraEdit这么好用,在没有UltraEdit前也许您只能把文件下载回来编辑好后再传上来,有了UltraEdit的话不需要这么麻烦了,他直接打开远程机器上的文件,保存后自动上传到远程服务器。

使用这个功能很简单,点菜单 文件->FTP/Telnet->从FTP打开,如下图。

如果您已经配置好了FTP帐号,那么点”浏览站点”就可以看到远程机器上的文件,选中要编辑的文件点打开就可以在UltraEdit中编辑了。见下图。

如果您是第一次使用这个功能,那么可以点上图中的”帐号”按钮,将会弹出下图所示的帐户管理器,通过简单的设置即可完成帐号的增加。

注意:不建议使用该功能编辑系统核心文件,保存的时候如果出现网络故障容易导致文件丢失。

冻结窗口

实现上UltraEdit中并没有冻结窗口这个概念,之所以这么中是因为UltraEdit可以实现类似Excel的冻结窗口的功能。在Excel中我们常用这个功能来固定表头,这样上下滚动的时候可以保持表头不动。

UltraEdit中可以实际固定左侧列,滚动水平条的时候只有右边动。例如一个书目文件,第一列是书名,而价格这一列在最后,中间夹着很多内容,当把价格这一类滚动到视图中间的时候却看不到书名。因此我们想把书名这一列固定下来,在滚动水平条的时候固定不动,先要设置一个列标记,点菜单 视图->设置列标记,见下图。

在出现的设置列标记对话框中,我们勾上第一行,并设置值为41,41是书名的结束列。如下图。

设好后,点”确定”,可以看到在41列的地方多了一条竖线,这个时候再点菜单 视图->不滚动标记1左侧,这样41列前的内容在水平条滚动的时候不会变,可以把后面的内容滚到前面来,见下图。

语法加亮

语法加亮是UltraEdit的一个突出亮点,它能像各种语言的IDE开发环境一样,对各种语法的关键字着色。UltraEdit通过一个叫wordfile的文件来定义各种语言的着色规则。通过添加语法规则即可增加UltraEdit的识别能力。

默认安装后的UltraEdit不支持Oracle的SQL语法着色,下面举例如何让UltraEdit识别Oracle的SQL脚本并对关键字着色。

首先打开wordfile定义文件,点菜单 高级->配置,在左侧找到”语法加亮”,点右边的”打开”按钮即可打开wordfile文件。

到官方网站下载Oracle的语法定义文件,官方提供了上百种语法的定义文件,可以根据需要下载,路径为http://www.ultraedit.com/downloads/extras.html#wordfiles

把下载回来的文件粘在wordfile的结尾保存一下就行了。如下图

但这里要注意一下,下回来内容的开头有一个/L后面有个数字,这个数据需要根据自己的情况改变一下。这是一个编号,不能和wordfile已有的编号重复,并且不能大于20。您可以通过以下方法确定这个编号,点一下工具栏上的”查看方式”按钮,

然后弹出下图的菜单,红色框内语言15到语言20都是目前系统没有用到的编号,因此在这里我们可以把这个编号改成15。

保存后,当我们再次打开Oracle的SQL脚本的时候,语法中的关键字已经会自动着色了。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值