#1 Python基础
前言:
这个系列的python笔记是廖雪峰官方网站的python教程的精简版本
适合以下人群食用:
-
尚未学习python,但有其他编程语言基础的朋友
可以用此文档对python入门,若想更深入了解,STFW or RTFM -
python初学者
可以用此笔记作为初级文档查阅复习 -
其它不知名目的的py
欢迎来玩^ _ ^
不符合以上3条的朋友建议自行 ^D
基本代码格式
采用缩进方式
以#
开头的语句是注释
# print absolute value of an integer:
a = 100
if a >= 0:
print(a)
else:
print(-a)
数据类型和变量
整数
-
Python可以处理任意大小的整数
对于很大的数,例如
10000000000
,很难数清楚0的个数。Python允许在数字中间以_
分隔,因此,写成10_000_000_000
和10000000000
是完全一样的。 -
用十六进制表示整数比较方便,十六进制用
0x
前缀和0-9,a-f表示例如:
0xff00
,0xa5b4c3d2
也可以写成
0xa1b2_c3d4
。
浮点数
-
浮点数可以用数学写法
如
1.23
,3.14
,-9.01
-
对于很大或很小的浮点数,必须用科学计数法表示
把10用e替代
1.23X29 就是
1.23e9
,或者12.3e8
0.000012可以写成
1.2e-5
字符串
-
字符串是以单引号
'
或双引号"
括起来的任意文本比如
'abc'
,"xyz"
-
如果
'
本身也是一个字符,那就可以用""
括起来比如
"I'm OK"
包含的字符是I
,'
,m
,空格,O
,K
这6个字符 -
如果字符串内部既包含
'
又包含"
怎么办?可以用转义字符\
来标识比如
'I\'m \"OK\"!'
-
Python还允许用
r''
表示''
内部的字符串默认不转义>>> print('\\\t\\') \ \ >>> print(r'\\\t\\') \\\t\\
-
如果字符串内部有很多换行,用
\n
写在一行里不好阅读,为了简化,Python允许用'''...'''
的格式表示多行内容>>> print('''line1 ... line2 ... line3''') line1 line2 line3
多行字符串
'''...'''
还可以在前面加上r
使用
布尔值
-
在Python中,可以直接用
True
、False
表示布尔值>>> True True >>> False False >>> 3 > 2 True >>> 3 > 5 False
-
布尔值可以用
and
、or
和not
运算。- and运算是与运算
>>> True and True True >>> True and False False >>> False and False False >>> 5 > 3 and 3 > 1 True
-
or
运算是或运算>>> True or True True >>> True or False True >>> False or False False >>> 5 > 3 or 1 > 3 True
not
运算是非运算
>>> not True False >>> not False True >>> not 1 > 2 True
空值
用None
表示
变量
用一个变量名表示,可以赋予、更改为任何类型的值
这种变量本身类型不固定的语言称之为动态语言,与之对应的是静态语言。静态语言在定 义变量时必须指定变量类型,如果赋值的时候类型不匹配,就会报错
常量
常量就是不能变的变量,通常用全部大写的变量名表示常量
#事实上PI仍然是一个变量,Python根本没有任何机制保证PI不会被改变,所以,用全部大写的变量名表示常量只是一个习惯上的用法
PI = 3.14159265359
字符串与编码
在最新的Python 3版本中,字符串是以Unicode编码的
ord() chr()
-
ord()
函数获取字符的整数表示>>> ord('A') 65 >>> ord('中') 20013
-
chr()
函数把编码转换为对应的字符>>> chr(66) 'B' >>> chr(25991) '文'
字符串的十六进制表示
-
如果知道字符的整数编码,还可以用十六进制这么写
str
:>>> '\u4e2d\u6587' '中文'
str与bytes编码格式转化
-
Python的字符串类型是
str
,在内存中以Unicode表示,一个字符对应若干个字节。如果要在网络上传输,或者保存到磁盘上,就需要把
str
变为以字节为单位的bytes
-
Python对
bytes
类型的数据用带b
前缀的单引号或双引号表示:x = b'ABC'
要注意区分
'ABC'
和b'ABC'
,前者是str
,后者虽然内容显示得和前者一样,但bytes
的每个字符都只占用一个字节。 -
以Unicode表示的
str
通过encode()
方法可以编码为指定的bytes
>>> 'ABC'.encode('ascii') b'ABC' >>> '中文'.encode('utf-8') b'\xe4\xb8\xad\xe6\x96\x87' >>> '中文'.encode('ascii') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128) ``` 纯英文的`str`可以用`ASCII`编码为`bytes`,内容是一样的,含有中文的`str`可以用`UTF-8`编码为`bytes`。含有中文的`str`无法用`ASCII`编码,因为中文编码的范围超过了`ASCII`编码的范围,Python会报错
-
如果我们从网络或磁盘上读取了字节流,那么读到的数据就是
bytes
。要把bytes
变为str
,就需要用decode()
方法>>> b'ABC'.decode('ascii') 'ABC' >>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') '中文'
-
如果
bytes
中包含无法解码的字节,decode()
方法会报错:>>> b'\xe4\xb8\xad\xff'.decode('utf-8') Traceback (most recent call last): ... UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 3: invalid start byte
-
如果
bytes
中只有一小部分无效的字节,可以传入errors='ignore'
忽略错误的字节:>>> b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore') '中'
-
要计算
str
包含多少个字符,可以用len()
函数:>>> len('ABC') 3 >>> len('中文') 2
-
len()
函数计算的是str
的字符数,如果换成bytes
,len()
函数就计算字节数:>>> len(b'ABC') 3 >>> len(b'\xe4\xb8\xad\xe6\x96\x87') 6 >>> len('中文'.encode('utf-8')) 6
-
编译含中文文本的py文件
当源代码中包含中文的时候,在保存源代码时,就需要务必指定保存为UTF-8编码。
当Python解释器读取源代码时,为了让它按UTF-8编码读取,我们通常在文件开头写上这两行:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
格式化的三种写法
-
在Python中,采用的格式化方式和C语言是一致的,用
%
实现,举例如下:>>> 'Hello, %s' % 'world' 'Hello, world' >>> 'Hi, %s, you have $%d.' % ('Michael', 1000000) 'Hi, Michael, you have $1000000.'
占位符 替换内容 %d 整数 %f 浮点数 %s 字符串 %x 十六进制整数 -
format()
另一种格式化字符串的方法是使用字符串的
format()
方法,它会用传入的参数依次替换字符串内的占位符{0}
、{1}
……,不过这种方式写起来比%要麻烦得多:>>> 'Hello, {0}, 成绩提升了 {1:.1f}%'.format('小明', 17.125) 'Hello, 小明, 成绩提升了 17.1%'
-
f-string
使用以
f
开头的字符串,称之为f-string
,它和普通字符串不同之处在于,字符串如果包含{xxx}
,就会以对应的变量替换:>>> r = 2.5 >>> s = 3.14 * r ** 2 >>> print(f'The area of a circle with radius {r} is {s:.2f}') The area of a circle with radius 2.5 is 19.62
使用list与tuple
list的介绍
声明
list是一种有序的集合:
>>> classmates = ['Michael', 'Bob', 'Tracy']
>>> classmates
['Michael', 'Bob', 'Tracy']
list可以嵌套
list内元素数据类型可以不同
len()_获取长度
用len()
函数可以获得list元素的个数:
>>> len(classmates)
3
空list的len为0
索引
用索引来访问list中每一个位置的元素:
>>> classmates[0]
'Michael'
>>> classmates[1]
'Bob'
>>> classmates[2]
'Tracy'
>>> classmates[3]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: list index out of range
当索引超出了范围时,Python会报一个
IndexError
错误,所以,要确保索引不要越界,记得最后一个元素的索引是len(classmates) - 1
。
如果要取最后一个元素,除了计算索引位置外,还可以用-1
做索引,直接获取最后一个元素:
>>> classmates[-1]
'Tracy'
>>> classmates[-2]
'Bob'
>>> classmates[-3]
'Michael'
>>> classmates[-4]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: list index out of range
当然,倒数第4个就越界了。
append_增添元素
list是一个可变的有序表,所以,可以往list中追加元素到末尾:
>>> classmates.append('Adam')
>>> classmates
['Michael', 'Bob', 'Tracy', 'Adam']
insert_插入元素
也可以把元素插入到指定的位置,比如索引号为1
的位置:
>>> classmates.insert(1, 'Jack')
>>> classmates
['Michael', 'Jack', 'Bob', 'Tracy', 'Adam']
pop()_删除元素
要删除list末尾的元素,用pop()
方法:
>>> classmates.pop()
'Adam'
>>> classmates
['Michael', 'Jack', 'Bob', 'Tracy']
要删除指定位置的元素,用pop(i)
方法,其中i
是索引位置:
>>> classmates.pop(1)
'Jack'
>>> classmates
['Michael', 'Bob', 'Tracy']
替换元素
要把某个元素替换成别的元素,可以直接赋值给对应的索引位置:
>>> classmates[1] = 'Sarah'
>>> classmates
['Michael', 'Sarah', 'Tracy']
tuple的使用
声明
另一种有序列表叫元组:tuple。tuple和list非常类似,但是tuple一旦初始化就不能修改,比如同样是列出同学的名字:
>>> classmates = ('Michael', 'Bob', 'Tracy')
注意:tuple嵌套了list后,list之中的元素可变
陷阱
定义一个只有1个元素的tuple:定义时必须加一个逗号,
>>> t = (1,)
>>> t
(1,)
若不加
,
则被判定为元素1,最外层括号被忽略
条件判断
示例:
if <条件判断1>:
<执行1>
elif <条件判断2>:
<执行2>
elif <条件判断3>:
<执行3>
else:
<执行4>
循环
for
示例1:
sum = 0
for x in [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]:
sum = sum + x
print(sum)
示例2:
names = ['Michael', 'Bob', 'Tracy']
for name in names:
print(name)
示例3:
sum = 0
for x in range(5):
sum = sum + x
print(sum)
while
示例:
sum = 0
n = 99
while n > 0:
sum = sum + n
n = n - 2
print(sum)
break
示例:
n = 1
while n <= 100:
if n > 10: # 当n = 11时,条件满足,执行break语句
break # break语句会结束当前循环
print(n)
n = n + 1
print('END')
continue
示例:
n = 0
while n < 10:
n = n + 1
if n % 2 == 0: # 如果n是偶数,执行continue语句
continue # continue语句会直接继续下一轮循环,后续的print()语句不会执行
print(n)
使用dict和set
dict的介绍
dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。
dict的key必须是不可变对象
声明
>>> d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
放入key值
>>> d['Adam'] = 67
>>> d['Adam']
67
取出key值
>>> d['Michael']
95
如果key不存在,dict就会报错:
>>> d['Thomas']
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'Thomas'
in_判断key是否存在
>>> 'Thomas' in d
False
get()_方法:如果key不存在,可以返回None
,或者自己指定的value
>>> d.get('Thomas')
>>> d.get('Thomas', -1)
-1
pop()方法_删除键值对
>>> d.pop('Bob')
75
>>> d
{'Michael': 95, 'Tracy': 85}
set的介绍
set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key。
set的key必须是不可变对象
声明
>>> s = set([1, 2, 3])
>>> s
{1, 2, 3}
!陷阱:
s = set([[1], 2, 3])
# key可变,会出错
互异性
>>> s = set([1, 1, 2, 2, 3, 3])
>>> s
{1, 2, 3}
add(key)
方法_添加元素
>>> s.add(4)
>>> s
{1, 2, 3, 4}
>>> s.add(4)
>>> s
{1, 2, 3, 4}
remove(key)
方法_删除元素
>>> s.remove(4)
>>> s
{1, 2, 3}
交集、并集操作
>>> s1 = set([1, 2, 3])
>>> s2 = set([2, 3, 4])
>>> s1 & s2
{2, 3}
>>> s1 | s2
{1, 2, 3, 4}