字符编码笔记

最新推荐文章于 2024-01-04 20:46:25 发布

Kachuan

最新推荐文章于 2024-01-04 20:46:25 发布

阅读量301

点赞数

分类专栏：笔记 python 编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kachuan/article/details/80293945

版权

笔记同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

基本概念

ASCII编码是1个字节，而Unicode编码通常是2个字节。

UTF-8编码：可变长的Unicode编码。把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节

编码应用
在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件：

浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器：

所以你看到很多网页的源码上会有类似<meta charset="UTF-8" />的信息，表示该网页正是用的UTF-8编码。

python编码
在最新的Python 3版本中，字符串是以Unicode编码的，也就是说，Python的字符串支持多语言，如：print(‘English & 中文’)

由于Python源代码也是一个文本文件，所以，当你的源代码中包含中文的时候，在保存源代码时，就需要务必指定保存为UTF-8编码。当Python解释器读取源代码时，为了让它按UTF-8编码读取，我们通常在文件开头写上这两行：

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

第一行注释是为了告诉Linux/OS X系统，这是一个Python可执行程序，Windows系统会忽略这个注释；第二行注释是为了告诉Python解释器，按照UTF-8编码读取源代码，否则，你在源代码中写的中文输出可能会有乱码。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Kachuan CSDN认证博客专家 CSDN认证企业博客

码龄7年

13: 原创

31万+: 周排名

186万+: 总排名

4万+: 访问

: 等级

568: 积分

45: 粉丝

39: 获赞

4: 评论

192: 收藏

私信

关注

热门文章

分类专栏

arduino 2篇
单片机 3篇
杂谈 1篇
linux 2篇
mysql 1篇
hadoop 1篇
Git 2篇
笔记 6篇
Java 2篇
python 2篇
编码 1篇
区块链 1篇
密码学 1篇
网络编程 1篇
docker 1篇
JavaWeb 1篇

最新评论

arduino两轮平衡车（二）-- 原理讲解
慕容大鱼: 这文章真是错误百出啊！
docker使用问题总结
天书的懒惰: 你解决了吗，兄弟，我也遇到了，，好鸡儿烦啊
docker使用问题总结
weixin_55052278: 我就创建一个管理节点报个错百度没找到跟我一样的错 Error response from daemon: manager stopped: can't initialize raft node: rpc error: code = Unknown desc = could not connect to prospective new cluster member using its advertised address: rpc error: code = DeadlineExceeded desc = context deadline exceeded
arduino两轮平衡车（二）-- 原理讲解
毒药台: 把代码写出来呀

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。