中国代码恒熠百度小偷V1.0之网页搜索

原创 2006年05月23日 10:25:00

演示见http://baidu.china-code.net/

作品来源:在做浙搜www.zhesou.com这个项目中,老板要求在三天内做好获取百度的网页内容和mp3的内容.

花了一个晚上基本上把这个任务完成。

做这个搜索的关键是编码和正则表达式。

下面主要说web.aspx.cs

 string str1,Result;
   string wd=System.Web.HttpUtility.UrlEncode(Request.QueryString["wd"], System.Text.Encoding.GetEncoding("GB2312"));
   string pn=Request.QueryString["pn"];
   if (pn=="")
   {
    pn="0";
   }
  //Response.Write("http://www.baidu.com/s?wd="+wd+"&pn="+pn+"&lm=0&si=&rn=10&ie=gb2312&ct=0&cl=3&f=1&");
   

   string PageUrl="http://www.baidu.com/s?wd="+wd+"&pn="+pn+"&lm=0&si=&rn=10&ie=gb2312&ct=0&cl=3&f=1&";
   WebClient wc = new WebClient(); 
       wc.Credentials = CredentialCache.DefaultCredentials; 
         Byte[] pageData = wc.DownloadData(PageUrl); 
          Result = Encoding.Default.GetString(pageData);
   
   
   string[] strtemp = System.Text.RegularExpressions.Regex.Split(Result,@"篇,用时");
   str1=strtemp[0];
   Result=strtemp[1];
   strtemp=null;
   strtemp = System.Text.RegularExpressions.Regex.Split(str1,@"找到相关网页约");
   str1=strtemp[1];
   strtemp=null;
   Response.Write("共有"+str1+"条记录<br>");
   strtemp = System.Text.RegularExpressions.Regex.Split(Result,"下一页");
   Result=strtemp[0]+"下一页</FONT></A></DIV>";
   strtemp=null;
   strtemp = System.Text.RegularExpressions.Regex.Split(Result,"DIV id=ScriptDiv>");
   Result=strtemp[1];
   strtemp=null;
   Result=System.Text.RegularExpressions.Regex.Replace(Result,@"- <a href=(/S*) target=""_blank/"" class=m>百度快照</a>","");
   Result=System.Text.RegularExpressions.Regex.Replace(Result,@"a href=s","a href=");
   Response.Write(Result);

BUG:1)当搜索记录小于100条时,系统出错。

             2)当搜索结果包含"下一页"时,系统显示不完全。

正在修正BUG中。

相关文章推荐

秋月家园-AJAX百度音乐小偷 v1.0

  • 2008年06月11日 11:14
  • 58KB
  • 下载

百度贴吧小偷采集 v1.0 已优化

  • 2012年10月27日 20:57
  • 20KB
  • 下载

PHP抓取百度贴吧邮箱v1.0

刚开始学习PHP,前段时间室友开了一个淘宝店铺,专门定制PPT,然后我准备弄一些邮箱来帮他发发广告什么的,于是就有了接下来的事情。 因为还不会PHP的很多东西,所以做出来的东西也是惨不忍睹,不过总算是...

仙吻百度搜索小偷 v1.03

  • 2005年12月23日 10:24
  • 5KB
  • 下载

基于JavaScript的网页版【定期存款计算器 - DepositCaculator v1.0】

使用方法:复制全部源代码,另存为.html文件。 免责声明:此程序为作者练习作品,不保证结果100%正确,对使用本程序造成的任何损失概不负责。 定期存款计算器 - Deposit...
  • t0nsha
  • t0nsha
  • 2011年07月30日 16:49
  • 1760

新浪音乐搜索小偷 v1.0

  • 2005年06月05日 16:05
  • 0B
  • 下载

百度站长链接实时提交工具V1.0

百度站长链接实时提交工具,软件使用百度站长工具里面的实时推送接口,然后模拟HTTP  Get、post操作数据的上传和下载,然后将要提交的链接实时推送给百度。 功能说明: 区域1:...

百度文库小偷 1.0

  • 2012年10月18日 17:04
  • 1.22MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:中国代码恒熠百度小偷V1.0之网页搜索
举报原因:
原因补充:

(最多只允许输入30个字)