Python学海无涯路【第01回】初始Python


1、Python简介

1.1、Python的作者

  python的创始人为吉多·范罗苏姆(Guido van Rossum)。1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言的一种继承。

1.2、Python的应用领域

  Python可以应用于众多领域,如:数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python,如:Youtube、Dropbox、BT、Quora(中国知乎)、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、腾讯、汽车之家、美团等。互联网公司广泛使用Python来做的事一般有:自动化运维、自动化测试、大数据分析、爬虫、Web 等。

1.3、Python的分类

1.3.1、Cpython

   Python的官方版本,使用C语言实现,使用最为广泛,CPython实现会将源文件(py文件)转换成字节码文件(pyc文件),然后运行在Python虚拟机上。

1.3.2、Jyhton

   Python的Java实现,Jython会将Python代码动态编译成Java字节码,然后在JVM上运行。

1.3.3、IronPython

  Python的C#实现,IronPython将Python代码编译成C#字节码,然后在CLR上运行。(与Jython类似)

1.3.4、 PyPy(特殊)

  Python实现的Python,将Python的字节码字节码再编译成机器码。

1.3.4、其它

  Python还有RubyPython、Brython ...等多个版本

1.4、Python2和Python3

  语法上Python3并不完全兼容Python2,Python 2里面的相当部分语法在Python 3中已经被弃用,也就是说Python3并不能保证完全运行Python2的语法写出来的程序,这点和其他语言相比差异比较大。   

  有种说法是Python2正在逐步的向Python3改变,慢慢的最终向Python3的语法无限接近,有个故事叫温水煮青蛙,大概可以在这里形容下这件事。

2、编码

2.1、ASCII

  ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。

2.2、Unicode

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多

Unicode是一个以’U+’字符开头,后面跟着4位或者5位或者6位十六进制数字

2.3、utf-8

  UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...   

  UTF-8用三个字节表示中文。   

  单字节的ASCII码字符仍然映射的是单字节,而且ASCII编码方式是UTF-8的子集  

2.4、GBK和GB2312

  GBK和GB2312是专门为中国人设计的编码,这两种编码中汉字占两个字节。

2.5、UTF-8和GBK的转换

  一个汉字,utf-8要用三个字节表示,gbk用2个字节表示。

   utf-8和gbk之间不能直接转换,只能通过Unicode转换,如下图所示: 

在这里插入图片描述

2.5、encode和decode

  UTF-8或者ASCII码不过是对应从Unicode到字节的映射方式,既然有映射方式,那么就有映射方向。我们把从Unicode到字节码(byte string)称之为encode,把从字节码(byte string)到Unicode码称之为decode 。

在这里插入图片描述

2.6、Python使用的编码

  Python2解释器默认以ASCII编码去解释py程序,如果py程序中只含英文,程序执行不受影响,如果含有中文,Python2将无法执行。

  所以用Python2解释器时,程序里需加上下面一句代码,告诉Python2解释时要按照UTF-8的编码去解释。

# -*- coding:utf8 -*-

Python3无此限制,Python3默认用utf-8。

2.7、Python源文件开头

#!/usr/bin/env python
#-*- coding: utf-8 -*-

第一行注释事为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;

第二行注释市为了告诉Python解释器,按照UTF-8编码读取源代码,否则,在源代码中写的中文输出可能会有乱码

3、注释

单行注视:# 被注释内容

多行注释:""" 被注释内容 “”"

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值