根据Url地址得到网页的html源码，截取网站信息的核心程序

最新推荐文章于 2023-09-22 17:07:50 发布

nick4

最新推荐文章于 2023-09-22 17:07:50 发布

阅读量738

点赞数

分类专栏： .NET C# 文章标签： url html string encoding stream null

本文链接：https://blog.csdn.net/nick4/article/details/2444214

版权

.NET 同时被 2 个专栏收录

32 篇文章 0 订阅

订阅专栏

27 篇文章 0 订阅

订阅专栏

　　/// <summary>
        /// 根据Url地址得到网页的html源码
        /// </summary>
        /// <param name="Url">URL地址</param>
        /// <returns></returns>
        public static string GetWebContent(string Url)
        {
            string strResult = "";
            try
            {
                HttpWebRequest request = (HttpWebRequest)WebRequest.Create(Url);
                //声明一个HttpWebRequest请求
                request.Timeout = 30000;
                //设置连接超时时间
                request.Headers.Set("Pragma", "no-cache");
                HttpWebResponse response = (HttpWebResponse)request.GetResponse();
                Stream streamReceive = response.GetResponseStream();
                Encoding encoding = Encoding.GetEncoding("GB2312");
                StreamReader streamReader = new StreamReader(streamReceive, encoding);
                strResult = streamReader.ReadToEnd();
            }
            catch
            {
                ;
            }
            return strResult;
        }

        /// <summary>
        /// 获取页面内容
        /// </summary>
        /// <param name="url">URL地址</param>
        /// <param name="temp1">内容开始段</param>
        /// <param name="temp2">内容结束段</param>
        /// <returns></returns>
        public static string gethtml(string url, string temp1, string temp2)
        {
            string temp = null;
            try
            {
                //获取内容

string strWebContent = GetWebContent(url);

strWebContent = strWebContent.Replace("<", "<");
strWebContent = strWebContent.Replace(">", ">");

                //取出和数据有关的那段源码
                int startstr, stopstr;
                startstr = strWebContent.IndexOf(temp1, 0, strWebContent.Length) + temp1.Length;
                stopstr = strWebContent.IndexOf(temp2, startstr);
                temp = strWebContent.Substring(startstr, stopstr - startstr);
            }
            catch
            {
            }
            return temp;
        }

nick4

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
根据Url地址得到网页的html源码，截取网站信息的核心程序

　　/// /// 根据Url地址得到网页的html源码 /// /// URL地址 /// public static string GetWebContent(string Url) { string strResult = ""; try
复制链接

扫一扫

专栏目录