解决从WebBrowser提取源码的乱码情况_delphi webbrowser getsource 乱码-CSDN博客

本文链接：https://blog.csdn.net/codeeer/article/details/8922891

在做一个项目，由于网页限制的原因，不能直接获取源码，系统返回一个500错误之后就跳出了。（源码如下）

public static string GetSource(string Url)
{
    using (WebClient myWebClient = new WebClient())
    {
        try
        {
            using (Stream myStream = myWebClient.OpenRead(Url))
            {
                using (StreamReader sr = new StreamReader(myStream, System.Text.Encoding.Default))
                {
                    return sr.ReadToEnd();
                }
            }
        }
        catch (Exception E)
        {
            MessageBox.Show(E.Message);
            return null;
        }
    }
}

不知道是不是这个获取方法存在问题，有木有大牛来围观下。。如果可以在这里就解决再好不过了~~先不说这个，进入正题。

由于必须用浏览器访问才能看到返回的错误信息（需要关闭浏览器的“友好信息”提示）

所以需要从WebBrowser提取数据。于是，乱码出现了……

切记，千万不要从DocumentText下手，那样的话输出字符的时候编码就已经确定了。

正确解法是处理DocumentStream。这个方法是写在DocumentCompleted事件下的：

Stream SS = WB.DocumentStream;
StreamReader Sr = new StreamReader(SS, Encoding.GetEncoding("euc-kr"));
richTextBox1.AppendText(Sr.ReadToEnd() + Environment.NewLine);

需要说明的是，“euc-kr”是朝鲜文，也就是我在处理的数据，需要用什么编码输出，直接指定就可以了。