在遇到中文字符乱码问题,归根结底就是因为编码格式不匹配,解决方法如下:
1、确定源网页的编码,如果是charset=“gb2312”,则在程序中要用gb18030。其他的对应相同即可。
2、将IDE中的编码格式也改成对应的编码格式。同样的如果是charset=“gb2312”,则在程序中要用gb18030。其他的对应相同即可。
文件--》settings--》Editor--》File Encodings
3、代码中的编码格式也需要和前两者对应起来,设置输出编码格式。(记得import sys哦)同样的如果是charset=“gb2312”,则在程序中要用gb18030。其他的对应相同即可。