python3中依旧会出现一些爬虫乱码
# -*- coding: utf-8 -*-
使用上述的不能解决问题
例如访问百度首页 ,用python自带的idel,返回text时会出现<title>ç™¾åº¦ä¸€ä¸‹ï¼Œä½ å°±çŸ¥é“</title的乱码,
如果此时用sublime运行该代码,会报错UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 318: illegal multibyte sequence
好像与sublime的print有关,sublime就是这么 神奇,话说他还不能用input指令。
使用content返回出现<title>\xe7\x99\xbe\xe5\xba\xa6\xe4\xb8\x80\xe4\xb8\x8b\xef\xbc\x8c\xe4\xbd\xa0\xe5\xb0\xb1\xe7\x9f\xa5\xe9\x81\x93</title