java正则 href_href= 正则表达式

//webclient.Proxy=newWebProxy("192.168.8.1",808);

webclient.Headers.Add("Referer", url);byte[] buff=webclient.DownloadData(url);

output=encode.GetString(buff);

}catch{

}returnoutput;

}publicstaticstringGetHTMLContent(stringstrTarget,stringstrBegin,stringstrEnd,refintbegin)

{stringresult;intposBegin, posEnd;

posBegin=strTarget.IndexOf(strBegin, begin);if(posBegin!=-1)

{

posEnd=strTarget.IndexOf(strEnd, posBegin+strBegin.Length);if(posEnd>posBegin)

{

result=strTarget.Substring(posBegin, posEnd+strEnd.Length-posBegin);

begin=posEnd+strEnd.Length;returnresult;

}

}

begin=-1;return"";

}//过滤特殊字符publicstaticstringRepalceStr(stringstr)

{

str=str.Replace("\r\n","");

str=str.Replace("\"","");str=str.Replace(":","");

str=str.Replace("\t","");

str=str.Replace(" ","");

str=str.Replace("'","");

str=str.Replace("\r","");

str=str.Replace("\n","");returnstr;

}publicstaticMatchCollection GetUrlFromHtml(stringstrContent)

{//string regex = @"\[^""]*)""|'(?[^']*)'|(?[^\>^\s]+)).*\>(?[^\]*)\]*/a\>";//string regex = @"\[^""]*)""|'(?[^']*)'|(?[^\>^\s]+)).*\>(?[^\]*)\]*/a\>";//string regex = @"\[^""]*)""|'(?[^']*)'|(?[^\>^\s]+))\s*(.*)\s*title=[""|'](?[\s\S])[""|'].*\>(?[^\]*)\]*/a\>";//string regex= "href=\"(?[\\s\\S]*?)\"[\\s\\S]title=\"(?[\\s\\S]*?)\"[\\s\\S]*?>(?[\\s\\S]*?)";//string regex = "[^\"]*)\"|'(?[^']*)'|(?[^\\>^\\s]+)).*\\>[\\s\\S]title=\"(?[\\s\\S]*?)\"[\\s\\S]*?>(?[\\s\\S]*?)";//string regex = "href=\"(?[\\s\\S]*?)\"[\\s\\S]*?title=\"(?[\\s\\S]*?)\"[\\s\\S]*?>(?[\\s\\S]*?)";//string regex = "href=['|\"](?[\\s\\S]*?)['|\"][\\s\\S]*?title='(?[\\s\\S]*?)'[\\s\\S]*?>(?[\\s\\S]*?)";//string regex = "href=(\'|\\\\\")(?[\\s\\S]*?)(\'|\\\\\")[\\s\\S]*?title=\\\\\"(?[\\s\\S]*?)\\\\\"[\\s" +"\\S]*?>(?[\\s\\S]*?)";stringregex="([^";//string p = "href=[\"](?[\\s\\S]*?)[\"][\\s\\S]*?title='(?[\\s\\S]*?)'[\\s\\S]*?>(?[\\s\\S]*?)";Regex reg=newRegex(regex, RegexOptions.IgnoreCase);

MatchCollection ms=reg.Matches(strContent);returnms;

}publicstaticstringGetNewsUrl()

{if(ConfigurationSettings.AppSettings["NewsUrl"]=="")return"";elsereturn"../desktop/getnewsUrl.aspx";

}#endregion}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值