Python for Windows 中文编码问题汇总

本文详细介绍了Python在Windows环境下处理中文编码的各种问题,包括Unicode、UTF-8和GBK编码的转换,以及Python文件编码设置、字符串类型、print输出中文、文件读写和爬虫结果存储的注意事项。建议在字符串处理中采用Unicode,并在数据输入输出时进行适当的decode和encode操作。
摘要由CSDN通过智能技术生成
  1. 关于python编码的基本常识

    • 在python里面 “明文”是unicode类型 “密文”是其他的编码格式 如gbk utf-8 latin-1等等
    • 编码: “明文”->”密文” .encode([目标编码格式]) 对象必须为unicode类型
    • 解码: “密文”->”明文” .decode([源编码格式]) 对象为str类型
    • 对于汉字 一共有三大类编码方式
      • 以中文汉字”李”为例子
      • a. unicode类 机器码 \x67\x4e
        • unicode(python表示) \u674e
        • HTML Entity &#x674E
        • UTF-16(BE) 0x674E
        • UTF-32(BE) 0x0000674E
      • b. UTF-8类 机器码 \xe6\x9d\x8e
        • UTF-8(python表示) \xe6\x9d\x8e
        • URL Escape Code %E6%9D%8E
        • Octal Escape Sequence \346\235\216
      • c. gb类 机器码 \xc0\xee
        • gb2312 gbk gb18030 \xc0\xee
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值