三种asp.net 抓取网页源代码,推荐方法一

        /// <summary>方法一:比较推荐
        /// 用HttpWebRequest取得网页源码
        /// 对于带BOM的网页很有效,不管是什么编码都能正确识别
        /// </summary>
        /// <param name="url">网页地址" </param>
        /// <returns>返回网页源文件</returns>
        public static string GetHtmlSource2(string url)
        {
            //处理内容
            string html = "";
            HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
            request.Accept = "*/*"; //接受任意文件
            request.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.1.4322)"; // 模拟使用IE在浏览 http://www.52mvc.com
            request.AllowAutoRedirect = true;//是否允许302
            //request.CookieContainer = new CookieContainer();//cookie容器,
            request.Referer = url; //当前页面的引用
            HttpWebResponse response = (HttpWebResponse)request.GetResponse();
            Stream stream = response.GetResponseStream();
            StreamReader reader = new StreamReader(stream, Encoding.Default);
            html = reader.ReadToEnd();
            stream.Close();
            return html;
        }
        

        //方法二:
        public static string GetHttpData2(string Url)
        {
            string sException = null;
            string sRslt = null;
            WebResponse oWebRps = null;
            WebRequest oWebRqst = WebRequest.Create(Url);
            oWebRqst.Timeout = 50000;
            try
            {
                oWebRps = oWebRqst.GetResponse();
            }
            catch (WebException e)
            {
                sException = e.Message.ToString();
            }
            catch (Exception e)
            {
                sException = e.ToString();
            }
            finally
            {
                if (oWebRps != null)
                {
                    StreamReader oStreamRd = new StreamReader(oWebRps.GetResponseStream(), Encoding.GetEncoding("utf-8"));
                    sRslt = oStreamRd.ReadToEnd();
                    oStreamRd.Close();
                    oWebRps.Close();
                }
            }
            return sRslt;
        }


        /// <summary>方法三:
        ///
        /// </summary>
        /// <param name="url">/要访问的网站地址</param>
        /// <param name="charSets">目标网页的编码,如果传入的是null或者"",那就自动分析网页的编码</param>
        /// <returns></returns>
        public static string getHtml(string url, params  string[] charSets)
        {
            try
            {
                string charSet = null;
                if (charSets.Length == 1)
                {
                    charSet = charSets[0];
                }
                WebClient myWebClient = new WebClient(); //创建WebClient实例myWebClient
                // 需要注意的:
                //有的网页可能下不下来,有种种原因比如需要cookie,编码问题等等
                //这是就要具体问题具体分析比如在头部加入cookie
                // webclient.Headers.Add("Cookie", cookie);
                //这样可能需要一些重载方法.根据需要写就可以了
                //获取或设置用于对向 Internet 资源的请求进行身份验证的网络凭据.
                myWebClient.Credentials = CredentialCache.DefaultCredentials;
                //如果服务器要验证用户名,密码
                //NetworkCredential mycred = new NetworkCredential(struser, strpassword);
                //myWebClient.Credentials = mycred;
                //从资源下载数据并返回字节数组.(加@是因为网址中间有"/"符号)
                byte[] myDataBuffer = myWebClient.DownloadData(url);
                string strWebData = Encoding.Default.GetString(myDataBuffer);
                //获取网页字符编码描述信息
                Match charSetMatch = Regex.Match(strWebData, "<meta([^<]*)charset=([^<]*)", RegexOptions.IgnoreCase | RegexOptions.Multiline);
                string webCharSet = charSetMatch.Groups[2].Value;
                if (charSet == null || charSet == "")
                    charSet = webCharSet;
                if (charSet != null && charSet != "" && Encoding.GetEncoding(charSet) != Encoding.Default)
                {
                    strWebData = Encoding.GetEncoding(charSet).GetString(myDataBuffer);
                }
                else
                {
                    strWebData = Encoding.GetEncoding("utf-8").GetString(myDataBuffer);
                }
                return strWebData;
            }
            catch (Exception e) { return ""; }
        }
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
2.源码特点: 一、网站后台布局:前端使用js jqury Html5 bootstrap布局 二、本系统后台采用ASP.NET MVC框架开发底层使用ADO.NET页面使用bootstrap js jquery razor引擎开发,前台使用标准web布局html+javsscript+css符合w3c标准。 3.功能介绍: 网站后台:主要包括登陆、用户管理、图片管理、企业文化管理、新闻中心管理、集团成员管理、 企业公民管理、加入企业公司管理、分别对应前台功能首页企业文化、新闻中心、集团成员、 企业公民、加入国享购、联系我们,操作增删改查 4.菜单功能 一、用户管理:主要可以对用户新增改查 二、图片管理:主要对首页图片,滚动图片,轮播图最新新闻等管理操作 三、企业文化管理:主要对前台企业文化中,集团概况、企业理念、领导团队、员工风采管理操作 四、新闻中心管理:主要对公司动态新闻进行管理操作。 五、集团成员管理、主要对集团成员中互联网、投资、旅游、贸易进行管理增删改查。 六、企业公民管理、主要对前台企业公民菜单进行管理操作 七、加入企业公司管理、主要对发布公司招聘信息和投递简历进行管理 5.注意事项: 1.网站使用Visual Studio2013 使用.net framework 4.5环境开发 2.管理员登陆名密码都设置为:51aspx 3.数据库在DB_51aspx文件夹下,数据配置在网站Web.config下配置, 数据库连接方式sa登录方式
ASP.NET FTP系统源代码是一种用于在ASP.NET平台上实现FTP功能的源代码。FTP(文件传输协议)是一种用于在计算机之间传输文件的标准协议。 ASP.NET是一种用于构建Web应用程序的微软技术,它使用具有服务器端脚本语言的服务器技术来生成动态网页ASP.NET FTP系统源代码通常包含以下功能: 1. 用户认证:允许用户通过用户名和密码进行身份验证,以便访问FTP服务器。 2. 目录浏览:显示FTP服务器上的文件和文件夹列表,以便用户可以浏览和查询。 3. 文件上传:允许用户将文件从本地计算机上传到FTP服务器上的指定位置。 4. 文件下载:允许用户从FTP服务器上下载文件到本地计算机上的指定位置。 5. 文件删除:允许用户删除FTP服务器上的文件。 6. 文件重命名:允许用户更改FTP服务器上文件的名称。 7. 目录创建和删除:允许用户在FTP服务器上创建和删除目录。 8. 权限控制:允许管理员对用户进行权限管理,例如授权用户只能上传文件而不能删除或下载文件。 9. 日志记录:记录所有FTP操作和事件,以便跟踪和故障排除。 ASP.NET FTP系统源代码可以使用C#或VB.NET等编程语言编写,并使用FTP客户端库,如System.Net.FtpClient命名空间提供的类来实现FTP功能。 开发人员可以根据自己的需求对ASP.NET FTP系统源代码进行定制和扩展,以满足特定的业务需求。他们可以添加额外的功能,如文件搜索、文件夹权限管理等。 总之,ASP.NET FTP系统源代码是实现FTP功能的一种解决方案,可用于构建功能完善的FTP服务器和客户端应用程序。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值