在获取网页时半角全角字符混合的问题

最新推荐文章于 2021-06-05 08:51:18 发布

samwell

最新推荐文章于 2021-06-05 08:51:18 发布

阅读量878

点赞数 1

分类专栏： Dotnet 文章标签： dotnet 半角全角 webclie

本文链接：https://blog.csdn.net/samwell/article/details/45772323

版权

Dotnet 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

在获取网页数据时，遇到一个问题。获取的数据在解析成中文时由于字符中包含半角和全角的字符，总是不能全部显示正确。一开始总想有什么解析方法可以用来处理这种数据。网页本身是utf-8格式，按理来说不应该有这个问题。后来发现是Dotnet中WebClient类默认会将中文转成gb2312。此时与原始的utf-8的数据相比，数据已有丢失，所以我判断再怎么恢复也不行（但不确定）。那WebClient有该属性配置么？果然！将Encoding属性设为utf-8就从头上解决了这个问题。回想之前在用扫码仪获取二维码中文时也遇到这个问题，也许也有相应的解决方法。