中国代码恒熠百度小偷V1.0之网页搜索

原创 2006年05月23日 10:25:00

演示见http://baidu.china-code.net/

作品来源:在做浙搜www.zhesou.com这个项目中,老板要求在三天内做好获取百度的网页内容和mp3的内容.

花了一个晚上基本上把这个任务完成。

做这个搜索的关键是编码和正则表达式。

下面主要说web.aspx.cs

 string str1,Result;
   string wd=System.Web.HttpUtility.UrlEncode(Request.QueryString["wd"], System.Text.Encoding.GetEncoding("GB2312"));
   string pn=Request.QueryString["pn"];
   if (pn=="")
   {
    pn="0";
   }
  //Response.Write("http://www.baidu.com/s?wd="+wd+"&pn="+pn+"&lm=0&si=&rn=10&ie=gb2312&ct=0&cl=3&f=1&");
   

   string PageUrl="http://www.baidu.com/s?wd="+wd+"&pn="+pn+"&lm=0&si=&rn=10&ie=gb2312&ct=0&cl=3&f=1&";
   WebClient wc = new WebClient(); 
       wc.Credentials = CredentialCache.DefaultCredentials; 
         Byte[] pageData = wc.DownloadData(PageUrl); 
          Result = Encoding.Default.GetString(pageData);
   
   
   string[] strtemp = System.Text.RegularExpressions.Regex.Split(Result,@"篇,用时");
   str1=strtemp[0];
   Result=strtemp[1];
   strtemp=null;
   strtemp = System.Text.RegularExpressions.Regex.Split(str1,@"找到相关网页约");
   str1=strtemp[1];
   strtemp=null;
   Response.Write("共有"+str1+"条记录<br>");
   strtemp = System.Text.RegularExpressions.Regex.Split(Result,"下一页");
   Result=strtemp[0]+"下一页</FONT></A></DIV>";
   strtemp=null;
   strtemp = System.Text.RegularExpressions.Regex.Split(Result,"DIV id=ScriptDiv>");
   Result=strtemp[1];
   strtemp=null;
   Result=System.Text.RegularExpressions.Regex.Replace(Result,@"- <a href=(/S*) target=""_blank/"" class=m>百度快照</a>","");
   Result=System.Text.RegularExpressions.Regex.Replace(Result,@"a href=s","a href=");
   Response.Write(Result);

BUG:1)当搜索记录小于100条时,系统出错。

             2)当搜索结果包含"下一页"时,系统显示不完全。

正在修正BUG中。

中国代码恒熠百度小偷V1.0(ASP.NET)

演示地址:http://baidu.china-code.net/目前的功能主要是偷百度网页和mp3的数据,可能还有些BUG需要完善。...
  • wwnsx
  • wwnsx
  • 2006年05月23日 09:50
  • 456

中国代码恒熠百度小偷V1.0之网页搜索(修正版)

中国代码恒熠百度小偷,演示地址http://baidu.china-code.net以下为修正的web.aspx.csstring str1,Result;   string wd=System.We...
  • wwnsx
  • wwnsx
  • 2006年05月28日 17:30
  • 1056

首闻百度网页搜索小偷V1.0 正式发布!

首闻百度网页搜索小偷V1.0  正式发布!开发日期:2009年2月21日开发商:北京首闻科技有限公司官方网站:www.ceowen.net               程序演示:www.ceowen....
  • ceowen
  • ceowen
  • 2009年02月21日 15:05
  • 168

20行代码写小偷程序

index.php $con = file_get_contents("http://it.sohu.com/s2010/5651/s274087241/index.shtml"); ...
  • HackProgramer
  • HackProgramer
  • 2014年05月22日 20:12
  • 499

百度网页搜索部实习生面试

这次面的是百度的网页搜索部的实习,下午2:00开始到下午4点半多结束。一共三面,一面和二面是技术面,三面是HR面,但是二面和三面的面试官是一个,本来二面的面试官让我等一下的,然后去找HR,但是回来的时...
  • u011082031
  • u011082031
  • 2014年12月02日 21:35
  • 1514

百度网页搜索部门面试经历

主要叙述一下面试的过程,顺便进行一定的总结。 面试官首先让进行自我介绍一下,我大概介绍了一下自己的基本信息,包含本科和硕士阶段的研究方向。 然后面试官开始提问,说我简历上有很多项目,咱们倒着说一下...
  • sbq63683210
  • sbq63683210
  • 2016年08月10日 19:18
  • 2799

Excel VBA 打开百度网页输入关键字并搜索

Sub 百度搜索() 'Excel VBA 打开百度网页输入关键字并搜索 Dim KW, Su With CreateObject("InternetExplorer.Application") .N...
  • gufengaoyue
  • gufengaoyue
  • 2013年12月05日 00:55
  • 2694

免费百度搜索引擎代码、Google搜索引擎代码、综合搜索引擎代码

一、百度搜索代码1、  type=hidden name=rn value=10>type=hidden name=lm value=0>src=http://www.hao123.com/logox...
  • andymeory
  • andymeory
  • 2007年04月09日 11:22
  • 4279

在页面中调用搜索引擎

今天突然想到,在自己的页面中调用google、百度这样强大的搜索引擎想必很酷。 于是上网查了资料,没想到就几行代码的事。 下面是调用百度的一个代码段: 调用百度引擎 ...
  • whoami021
  • whoami021
  • 2014年03月16日 02:25
  • 1816

PHP 简单的小偷程序

小偷程序:把远程网站上的数据(图片,网页及其他文件)抓取到本地,处理后再显示 正则表达式:用于字符串的模式分割 、匹配、查找及替换操作。 相关函数: int ereg ( string $patte...
  • theArcticOcean
  • theArcticOcean
  • 2016年02月23日 23:00
  • 2319
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:中国代码恒熠百度小偷V1.0之网页搜索
举报原因:
原因补充:

(最多只允许输入30个字)