文本处理'utf8' codec can't decode特殊解决方案

原创 2018年04月17日 10:08:28

一般情况下,在Python文件最开始输入↓就可以解决大部分问题

# -*- coding:utf-8 -*-

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

再不济,直接全部修改编码格式吧→如何修改Python编码格式 

然而,人生不是一帆风顺,改过去改过来还是一堆bug,比如像我...


敲重点!!!

这时候,来试一试替换一些乱七八糟的东西吧!!!

先在报错代码前输入 print XXX,看显示了啥:


看见没看见没!!!“令人作呕”的“\xef\xbc\x8c”,哦豁...

出现诸如此类的“\xef\xbc\x8c”,“\xef\xbb\xbf”,全部替换掉。

朕的替换代码↓

 # 需要加上的替换代码
    for line in open('/Users/caixiaoniao/Desktop/test 2.txt','r').readlines():
        if '\xef\xbc\x8c' in line:
            line = line.replace('\xef\xbc\x8c', ' ')
        corpus.append(line.strip())
    print corpus

再运行,(o゜▽゜)o☆[BINGO!]!!!

[我是个小透明——虽然我知道,我犯这样的错误,很愚蠢╥﹏╥...,但是还是要记录一下...]

日志收集解决方案ELKStack实践

-
  • 1970年01月01日 08:00

PYTHON 2.7 error: 'utf8' codec can't decode byte 终极解决办法

1、从百度上搜索到的答案大部分是添加# -*- coding: utf-8 -*- # 但是,添加后问题并没有解决。 2、又改为# -*- coding: GBK -*- # ,问题还是没解决。 3、...
  • gavinking0110
  • gavinking0110
  • 2016-11-24 13:24:16
  • 11880

ride.py中文用户名:UnicodeDecodeError:'utf8'codec can't decode byte 0xb2 in position 9: invalid start byte

上次解决了python中文用户名的问题,最近用RF发现也有这个问题,报UTF-8的错误 错误日志: 解决方法 1、首先创建c:\Robotframework\temp\文件夹(也可以是其他非中文...
  • huashao0602
  • huashao0602
  • 2017-01-13 10:02:40
  • 3905

ambari客户端一直lost状态(UnicodeDecodeError: 'utf8' codec can't decode)

近期ambari有 一台客户端一直为lost状态,各服务无法操作,查看ambari-agent状态正常。 # service ambari-agent status Found ambari-agen...
  • levy_cui
  • levy_cui
  • 2016-04-13 14:27:24
  • 905

'utf8' codec can't decode byte

文件导致
  • chenggong2dm
  • chenggong2dm
  • 2014-06-16 15:52:51
  • 59947

Python urllib2报错"UnicodeDecodeError: 'utf8' codec can't decode byte 0xa1"

用python的urllib2抓取web页面时发现中文显示的乱码: import urllib2 #获取手机号的归属地 url = "http://www.ip138.com:8080/searc...
  • clliu
  • clliu
  • 2016-12-08 14:34:26
  • 3286

json.dumps错误:'utf8' codec can't decode byte解决方案

转载自http://www.pythontab.com/html/2013/pythonjichu_0105/100.html 一次在使用json.dumps()过程中,出现错误提示...
  • QQ331948781
  • QQ331948781
  • 2015-11-02 16:44:47
  • 1402

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0: invalid continuation byte问题

在用python编码的时候,想把一txt文件里面的东西,插入到excel表格中,结果出现了UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xd1...
  • u011732358
  • u011732358
  • 2017-09-16 09:57:16
  • 2846

UnicodeDecodeError: 'utf8' codec can't decode byte 0xc9 in position 0: inval

核心内容: 1、字符编码的问题 2、解决的措施问题是这样的,今天在用python运行程序的时候,在Windows平台下是没有任何问题的,但是当在Linux平台下运行程序的时候,总是报下面的错误:U...
  • a2011480169
  • a2011480169
  • 2017-04-01 20:50:19
  • 9828

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd6 in position 0: invalid continuation byte

Traceback (most recent call last): File "C:\Python27\lib\site-packages\flask\app.py", line 1997, i...
  • chenyongtu110
  • chenyongtu110
  • 2017-08-02 17:10:22
  • 320
收藏助手
不良信息举报
您举报文章:文本处理'utf8' codec can't decode特殊解决方案
举报原因:
原因补充:

(最多只允许输入30个字)