gecco爬虫框架获取到页面中文乱码问题
//看了gecco使用文档,没有找到,看了源码才发现的问题,希望能给刚学的人带来一点帮助产生问题的原因在于,获取页面内容的格式是不一致.例如:页面的编码格式是gb2312而代码获取内容的编码格式utf-8.由于格式不一致导致乱码.有人会说,可以将utf-8编码在转成gb2312就可以了.事实上,并不是这样的.@Configuration@ComponentScan(basePackages = {
原创
2018-01-12 17:53:16 ·
737 阅读 ·
0 评论