11-24-day06-python入门-字符编码与文件

最新推荐文章于 2020-12-08 19:25:30 发布

白瑾2

最新推荐文章于 2020-12-08 19:25:30 发布

阅读量165

点赞数

分类专栏：基础知识文章标签： python 乱码

本文链接：https://blog.csdn.net/ponyzzzzzz/article/details/110093032

版权

基础知识专栏收录该内容

17 篇文章 0 订阅

订阅专栏

一：字符编码
1.什么是字符编码
文字符号-------------编码--------------------------------》数字
文字符号《-------------解码-------------------------------数字
2.为何要用字符编码
为了解决乱码问题：

1.存取都用同一张字符编码
2、为何要研究字符编码
为了解决乱码问题：
1、存取都用同一张字符编码表

3、储备知识

4、字符编码表的发展历程
1、一家独大
ASCII：只能识别英文字符
用8个bit对应一个英文字符

2、天下大乱
    GBK：能识别中文和英文
        用16个bit（2Bytes）对应一个字符

    shift-JIS

    Euc-KR
3、归于一统
    unicode：能识别万国字符
        用16bit（2Bytes）对应一个字符


    utf-8

5.运行python程序的三个阶段
1.先启动一个python解释器
2.python解释器会将文件内容从硬盘读入内存
3.python解释器会解释执行刚刚读入内存的代码，识别语法

总结：
    英文字符----》内存（ASCII格式的二进制数）----》硬盘（ASCII格式的二进制数）

中文、英文字符---》内存（GBK格式的二进制数）----》硬盘（GBK格式的二进制数）
日文、英文字符---》内存（Shif-jis格式的二进制数）--》硬盘（Shif-jis格式的二进制数）

    万国字符----》内存（unicode格式的二进制数）--》硬盘（utf-8格式的二进制数）

二：文件的打开方式