Python编解码

最新推荐文章于 2024-05-16 00:09:33 发布

哈尼诺

最新推荐文章于 2024-05-16 00:09:33 发布

阅读量346

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/weixin_42857241/article/details/117631111

版权

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一、文件编码

在Python解释器中字符串有两种类型：str、unicode。

其中，unicode是默认的类型；而str则是unicode之外的其他类型，可能是ascII、gbk、utf-8等。unicode类型只存在于Python解释器中，当需要’向外输出‘时需要将unicode类型转换成对应的str类型；而Python解释器从’外部读取‘数据时则需要从str类型转成unicode类型。

#!/usr/bin/python #执行程序申明
# –– coding: utf-8 –– #文件编码申明

a = u'中国'
print type(a) # => unicode
#通过在字符串前面添加一个u字符，即可申明字符串为unicode类型。这样申明的字符串在载入解释器时会被自动转为unicode类型。

import codecs
f=codecs.open('test.txt','r','utf8')
  #这里使用了codecs模块，是专门用于解决文件编码问题的库。它可以很好地解决文件读写的编解码问题。

二、数据库编码

数据库作为最常用的外部数据源，其读取和写入都需要预先设置好编码方式。例如，数据库的编码为gbk，那么在连接数据库时就需要指定编码为gbk。

以MySQLdb库为例设置编码方式如下：
conn=MySQLdb.Connect(host="localhost",user="root",passwd="root",db="test",charset="gbk")
#这里建立了一个数据库连接，IP为本机地址，用户名为root，密码为root，数据库名为test，编码为gbk。通过该连接读取数据时，返回的数据编码直接为unicode类型；而当我们需要写入数据到数据库时，记得要提前把数据都转换为unicode或gbk类型。

三、编解码函数

在Python中可以进行编解码的函数有str.decode、str.encode、unicode、str。

当获取到的字符类型为str时，则它有可能是ASCII、gbk、utf-8等编码中的一种。此时的字符为已编码形式，将str转换为unicode类型即为解码。编码的过程与解码刚好相反，即从unicode转换为str类型。

哈尼诺

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python编解码

在Python解释器中字符串有两种类型：str、unicode。其中，unicode是默认的类型；而str则是unicode之外的其他类型，可能是ascII、gbk、utf-8等。unicode类型只存在于Python解释器中，当需要向外输出时需要将unicode类型转换成对应的str类型；而从外部读取数据时则需要从str类型转成unicode类型...
复制链接

扫一扫