正则表达式:为站内链接加上域名

1、测试文本

1
2
3
4
5
6
7
< a  href='http://search/a.aspx'>home</ a >
 
< a  href='/aab/bb'>hello</ a >< a  href='http://www.sohu.com'>sohu</ a >< p >sdfsf</ p >
 
< a  href="/aab/bb">hello</ a >
< div >hello world</ div >
< a  href="aaa/bb"></ a >

 

2、为站内链接加上域名

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
using  System;
using  System.Collections.Generic;
using  System.Linq;
using  System.Text;
using  System.Text.RegularExpressions;
using  System.IO;
 
namespace  ConsoleApplication1
{
     class  Program
     {
         static  void  Main( string [] args)
         {
             string  s = File.ReadAllText( @"c:\a.txt" );
 
             //给所有非http的链接加上域名,链接前无/
             string  d = Regex.Replace(s,
                 @"<a\s+href\s?=\s?[\'|\""]((?!http)/.*)?[\""\']" ,
 
                 @"<a href=""www.cnblogs.com$1""" ,
 
                 RegexOptions.Compiled|RegexOptions.IgnoreCase);
 
             //给所有非http的链接加上域名,链接前有/
             string  e = Regex.Replace(d,
                 @"<a\s+href\s?=\s?[\'|\""]((?!http)(?!/).*)?[\""\']" ,
 
                 @"<a href=""www.cnblogs.com/$1""" ,
 
                 RegexOptions.Compiled | RegexOptions.IgnoreCase);
 
             // Console.WriteLine(d);
 
             Console.WriteLine(e);
 
             Console.Read();
 
         }
     }
}

a. 不包含http, (?!http)表示。

b. 非贪婪匹配 ?> 代表遇到第一个>匹配结束。

c. $1代表前面的组1.

d. 双引号在模式里\""

e. 双引号在@转义的字符串里用两个""表示.

本文转自敏捷的水博客园博客,原文链接http://www.cnblogs.com/cnblogsfans/archive/2010/01/24/1655121.html如需转载请自行联系原作者


王德水

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值