最近.NET CORE做网络爬虫的时候,遇到了charset=gbk,转码的时候,发现直接使用Encoding.GetEncoding(“GB2312”)抛异常了。好吧,看到这个的时候,我是一脸懵逼的。无奈,毕竟.NET CORE不是.Net,做过精简,做过调整。然后,开始搜索相关资料,参考网址http://www.cnblogs.com/artech/p/encoding-registeration-4-net-core.html,做了两步操作:
1. 引入了System.Text.Encoding.CodePages.dll
2. 在启动的时候,注册EncodingProvider,执行代码如下:
Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
这样,就可以在程序中使用GB3212编码了。
另外,我也在msdn上找到了相关资料,参考地址如下:
1.