中文编码
矮油1
尘世间一个迷途小书童
展开
-
中文编码 1:常见中文编码格式
为什么要有中文编码格式? 最早的ASCII码只包括了字母、标点符号、特殊字符等127个字符。这些字符对于拉丁语系国家的人使用是足够的,但是对于非拉丁语系国家(如中国、日本等),ASCII码就远远不够了。因此就需要编码来表示大量的汉字字符。常用的几种中文编码格式:1、Unicode编码 Unicode编码通常由两个字节组成,称作USC-2,个别偏僻字...原创 2018-07-18 19:24:45 · 52606 阅读 · 2 评论 -
中文编码2:python中的编解码问题
1、python2中默认ASCII编码,读取汉字会报错解决: 在字符串前加u,将其指定为utf-8编码,如print u'我爱你中国' 在程序开头加 # -*- coding: UTF-8 -*- 或者 #coding=utf-8 注意:=两边不要空格 更改 sys.defaultencoding 为文件的编码方式 import sysreload(sys)sys.set...原创 2018-07-18 20:31:26 · 291 阅读 · 0 评论 -
中文编码3:python中的编解码攻略
转自:https://blog.csdn.net/five3/article/details/51887086 正如其他语言一样,在Python的世界里也有有字符的编解码问题;有的在命令行回显时出现,有的在读取文件时出现,有的在执行命令时出现,有的在读取数据库时出现,不尽相同。注:如未特别申明下文中的编解码均特指字符串的编解码。 之所以会出现编解码问题是因为程序不同处理...转载 2018-07-18 20:50:40 · 317 阅读 · 0 评论