python之文件编码格式相关

1、查看文件的编码格式

import chardet
f = open('one.txt','r')
data = f.read()
print(chardet.detect(data))
输出为:
{'confidence': 数字, 'encoding': 'utf-8'}

2、python2和3在处理字符串上的区别
<1> python2中unicode作为一种字符串类型,可使用decode是将str型转换为unicode型

type(u"a") => str型
type("a".decode('utf8')) => unicode型

<2>python3中默认所有字符串都是unicode型,不存在单独的unicode型。但存在byte型,可使用decode是将byte型转换为str型

type("a".decode('utf8')) => 报错,python3不能这样写
type(b'132') => byte型

注:
(1)print在输出时会默认其为unicode编码的字符串;
(2)可在decode时加上一个ignore;
(3)读取文本时先看其编码方式再以该种方式读取;
(4)用encode和decode完成编码格式的转换。

参考:https://www.jb51.net/article/26543.htm

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值