问题1
今天重新在Pyton IDE里运行了一下之前的淘宝爬虫代码,发现报错UnicodeEncodeError: ‘latin-1’ codec can’t encode character ‘\u2026’ in position…
解决方案是在代码中去除在headers中的省略号…
本人发现的省略号在cookie里。其他情况就是省略号会出现在user-agent等地方。
在FireFox中打开请求头中的“原始”再复制数据到代码中即可
不过在彻底解决问题之前有出现并没有找到省略号但是依然报错的情况(后面重新登录了淘宝之后又在cookie里找到了,不知道是IDE的问题还是淘宝的问题)。在这种情况下使用了字符转码,但是又会出现下述的【问题2】
字符转码参考文章:https://blog.csdn.net/xiongzaiabc/article/details/107128226?spm=1001.2101.3001.6650.13&utm_medium=distribute.pc_relevant.none-task-blog-2defaultBlogCommendFromBaiduRate-13.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2defaultBlogCommendFromBaiduRate-13.pc_relevant_default
问题2
之后还遇到的问题就是UnicodeEncodeError: ‘UCS-2‘ codec can‘t encode characters in position…
找了一圈都没有解决,后面发现是IDE不支持的原因,换成了anaconda spyder跑同样的代码就没问题了。
总结
如果只是普通写算法题用IDE是没问题的,但是如果是用来做项目或者学习的话建议用其他编译器。