ftp在window和Linux之间传文件UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8a in position : invalid

今天的代码要使用一个生成好的txt文件。开始我是将这个文件生成的代码放在Linux上执行的,然后在Linux上测试使用这个txt文件的代码发现也是可以正常运行的。

然后我把代码和txt文件提交到git,自动部署的时候报错了:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8a in position 2428: invalid start byte

我发现将Linux上的txt文件用xftp拉到本地之后,再将这个本地的txt文件用ftp传到Linux上,使用这个文件的时候就会报错(因为我是将文件在本地传到git上,git自动部署的时候出的错,所以这里用这种拉两次的方法模拟我传代码然后部署时文件的传输):

我看了下,我生成的文件和使用时解析的文件都是utf-8的,不是这个的utf-8编码的问题。

实验了下,发现是这个txt文件在win和Linux中间转换的时候出的问题,之前遇到过这个问题。当时只是在远端使用,可以通过命令来消除这个编码的错误,具体看这个博客:

Linux中dos2unix批量转换 - 抟九 - 博客园

但是由于这个文件是需要我传到git上,然后自动部署的,所以我本地window这里是必须要有一个正确的文件的。

然后我想是不是txt文件才有这个问题,我记得我之前是用过pickle来存数据,是没有报这个错的。于是我用pickle来存储内容,避开txt。(py文件我各个系统直接拉来拉去就不会有这个问题,所以应该只有一部分种类的文件会有这个问题)

但是尝试了下,Linux生成pickle文件,ftp拉到本地然后ftp再传到Linux之后,发现还是有这个问题。这里我还尝试了先把文件压缩成tar.gz包,也不行,解压的时候就会报错,然后使用文件的时候还是有问题。

然后对比之前我用pickle的情况,实验后发现,是Linux上ftp拉到本地的时候会导致格式错误,但是本地生成的正常文件用ftp传到Linux是不会出错的。

这里我就把生成pickle文件的代码放到了本地执行,将生成的pickle文件用ftp传到Linux就可以正常执行了。

txt文件因为没有尝试,不知道是不是和pickle一样的,Linux拉Windows的时候会出错,还是无论Linux到Windows还是Windows到Linux都会出错。

总之,pickle文件 从Linux用ftp传到本地windows系统的时候会有unix变dos编码的错误,在文件中加了系统无法识别的字符。

我这里直接本地生成,从Windows到Linux用ftp的话是不会有这个错误的,所以我这里是避免了Linux生成然后ftp拉到本地的操作,将文件生成挪到Windows上执行。

我这里的方法其实是避开了解决这个问题,没有去解决。不过已经知道了,出错的地方就是,用ftp从Linux传pickle文件到本地windows系统会有unix变dos编码的错误,具体解决方法看使用情况吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
UnicodeDecodeError是Python中的一个异常,表示在解码Unicode字符串时发生了错误。具体地说,"utf-8 codec can't decode byte 0x8f in position 18: invalid start byte"这个错误表示在使用UTF-8编解码器解码字节序列时,遇到了无效的起始字节0x8f。 UTF-8是一种变长编码方式,它使用1到4个字节来表示一个Unicode字符。在UTF-8编码中,每个字节的最高位用于标识该字节是否为一个字符的起始字节,如果一个字节的最高位为0,则表示该字节为一个字符的起始字节;如果最高位为1,则表示该字节为一个字符的后续字节。 在你提供的错误信息中,字节序列中的第18个字节0x8f被认为是无效的起始字节,因此无法正确解码。这可能是由于以下原因导致的: 1. 字节序列中包含了非UTF-8编码的字节。 2. 字节序列中的某些字节丢失或损坏。 3. 字符串本身不是以UTF-8编码保存的。 要解决这个问题,你可以尝试以下几种方法: 1. 确保输入的字节序列是以UTF-8编码保存的,并且没有丢失或损坏的字节。 2. 如果你知道输入的编码方式,可以尝试使用相应的编码器进行解码。 3. 如果你不确定输入的编码方式,可以尝试使用Python的chardet库来自动检测编码方式。 4. 如果你无法修复输入的字节序列,可以考虑使用错误处理机制来处理解码错误,例如忽略错误的字节或替换为特定的占位符。 希望以上信息对你有帮助!如果你还有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值