- 龟叔 Guido van Rossum 在1989年圣诞节期间编写的一个编程语言。
- Python为我们提供了非常完善的基础代码库,覆盖了网络、文件、GUI、数据库、文本等大量内容,被形象的称为‘内置电池’。
- Python的定位:优雅、明确、简单
- Python的缺点:运行速度慢,代码不能加密
- 安装Python,去https://www.python.org/downloads/windows/ 网址下载最新版的window上的Python。
- Python文件以.py为扩展名;运行此类型文件需要Python解释器去执行。CPython是刚才下载安装Python的时候自带的,它是用C语言开发的,所以叫CPython。在命令行下运行Python就是启动CPython解释器。
- 命令行模式和交互模式
- 新建hello.py文件,里面写入print('hello world, this is my first python') ,然后cd进入该目录,用Python hello.py 命令来执行该文件。
- 在Python交互式模式下,可以直接输入代码,然后执行,并立刻得到结果。在命令行模式下,可以直接运行.py文件。
- I/O:Python中,输入是input(),输出是print()
- 计算机只处理数字,最早的计算机设计时采用8比特作为一个字节byte,所以,一个字节能表示的最大的整数就是255。所以如果要表示更大的整数,就必须用更多的字节。比如两个字节可以表示的最大整数是65535.
- 由于计算机是美国人发明的,因此最早只有127个字符被编码进计算机了,也就是大小写英文字母数字和一些符号,这个编码表就是ASCII表。
- 但是要处理中文一个字节不够,至少要2个字节,还不能和ASCII冲突,所以,中国制定了GB2312编码,用来把中文编码进去。
- 但是,世界上百种语言,各国都有自己的标准,不可避免的会有冲突,在多语言混合的文本中,显示出来就会有乱码。
- 因此,Unicode应运而生,它把所有的语言编写到一套编码里面,这样就不会有乱码了。一般在Unicode中用2个字节表示一个字符。ASCII用1个字节表示一个字符
- 但是,如果文本都用英文的话,用Unicode编码比ASCII多一倍的存储空间,在存储和传输上不划算。
- 因此,出现了把Unicode编码转为‘可变长编码’的UTF-8编码。utf-8把一个Unicode字符根据不同的数字大小编成1-6个字符,常用的英文编写为1个字节,汉字通常是3个字节,很生僻的字符编成4-6字节。
- 在现在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或需要传输的时候,转为utf-8
- 用记事本编辑的时候,从文件读取的utf-8字符被转化为Unicode到内存中,编辑完成后,保存的时候再把Unicode转为utf-8保存文件