一、执行python的两种方式
1、写在脚本里面调用python执行,列如python test.py
2、输入python在命令行执行,列如
python >>> print 'hello world'
二、简述 位、子节的关系
位(bit)来自英文bit,音译为”比特“,表示二进制位。位是计算机内部数据储存的最小单位。
子节(byte)子节来自Byte。子节是计算机中数据处理的基本单位。计算机中以字节为单位储存和解释信息,规定一个字节是由八个二进制位构成,即1个字节等于8个比特(1Byte = 8 Bit)。八位二进制数最小为00000000,最大为11111111;通常1个字节可以存入1个ASCII,2个字节可以存放一个汉字国标码。
三、简述ascii,unicode,utf-8,gbk的关系
1、ASCII码
这是美国在19世纪60年代的时候为了建立英文字符和二进制的关系时制定的编码规范,它能表示128个字符,其中包括英文字符、阿拉伯数字、西文字符以及32个控制字符。它用一个字节来表示具体的字符,但它只用后7位来表示字符(2^7=128),最前面的一位统一规定为0。
2Unicode
正如上一节所说,世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码。为什么电子邮件常常出现乱码?就是因为发信人和收信人使用的编码方式不一样。而Unicode就是这样一种编码:它包含了世界上所有的符号,并且每一个符号都是独一无二的。比如,U+0639表示阿拉伯字母Ain,U+0041表示英语的大写字母A,U+4E25表示汉字“严”。具体的符号对应表,可以查询unicode.org,或者专门的汉字对应表 。很多人都说Unicode编码,但其实Unicode是一个符号集(世界上所有符号的符号集),而不是一种新的编码方式。
但是正因为Unicode包含了所有的字符,而有些国家的字符用一个字节便可以表示,而有些国家的字符要用多个字节才能表示出来。即产生了两个问题:第一,如果有两个字节的数据,那计算机怎么知道这两个字节是表示一个汉字呢?还是表示两个英文字母呢?第二,因为不同字符需要的存储长度不一样,那么如果Unicode规定用2个字节存储字符,那么英文字符存储时前面1个字节都是0,这就大大浪费了存储空间。
上面两个问题造成的结