Python3入门(六)
Python3数据结构
一、列表
Python中列表是可变的,这是它区别于字符串和元组的最重要的特点。即,列表可以修改,而元组和字符串不行。
以下是Python中列表的方法:
方法 | 描述 |
---|---|
list.append(x) | 把一个元素添加到列表的结尾,相当于 a[len(a):] = [x]。 |
list.extend(L) | 通过添加指定列表的所有元素来扩充列表,相当于 a[len(a):] = L。 |
list.insert(i, x) | 在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引,例如 a.insert(0, x) 会插入到整个列表之前,而 a.insert(len(a), x) 相当于 a.append(x) 。 |
list.remove(x) | 删除列表中值为 x 的第一个元素。如果没有这样的元素,就会返回一个错误。 |
list.pop([i]) | 从列表的指定位置移除元素,并将其返回。如果没有指定索引,a.pop()返回最后一个元素。元素随即从列表中被移除。(方法中 i 两边的方括号表示这个参数是可选的,而不是要求你输入一对方括号,你会经常在 Python 库参考手册中遇到这样的标记。) |
list.clear() | 移除列表中的所有项,等于del a[:]。 |
list.index(x) | 返回列表中第一个值为 x 的元素的索引。如果没有匹配的元素就会返回一个错误。 |
list.count(x) | 返回 x 在列表中出现的次数。 |
list.sort() | 对列表中的元素进行排序。 |
list.reverse() | 倒排列表中的元素。 |
list.copy() | 返回列表的浅复制,等于a[:]。 |
实例:
a = [66.25, 333, 333, 1, 1234.5]
print(a.count(333), a.count(66.25), a.count('x'))
a.insert(2, -1)
print(a)
a.append(333)
print(a)
a.index(333)
print(a)
a.remove(333)
print(a)
a.reverse()
print(a)
a.sort()
print(a)
#输出结果:
#2 1 0
#[66.25, 333, -1, 333, 1, 1234.5]
#[66.25, 333, -1, 333, 1, 1234.5, 333]
#[66.25, 333, -1, 333, 1, 1234.5, 333]
#[66.25, -1, 333, 1, 1234.5, 333]
#[333, 1234.5, 1, 333, -1, 66.25]
#[-1, 1, 66.25, 333, 333, 1234.5]
注意:类似 insert,remove 和 sort 等修改列表的方法没有返回值。
1.将列表当作堆栈使用
列表方法使得列表可以很方便的作为一个堆栈来使用,堆栈作为特定的数据结构,最先进入的元素最后一个被释放(后进先出)。用append() 方法可以把一个元素添加到堆栈顶,用不指定索引的 pop() 方法可以把一个元素从堆栈顶释放出来。
stack = [3, 4, 5]
stack.append(6)
stack.append(7)
print(stack)
stack.pop()
stack.pop()
stack.pop()
print(stack)
#输出结果:
#[3, 4, 5, 6, 7]
#[3, 4]
2.将列表当作队列使用
也可以将列表当做队列使用,只是在队列里第一加入的元素,第一个取出来;但是列表用作这样的目的效率不高。在列表的最后添加或者弹出元素速度快,然而在列表里插入或者从头部弹出速度却不快(因为所有其他的元素都得一个一个地移动)
实例:
from collections import deque
queue = deque(['hello', 'john', 'jack'])
queue.append('terry')
queue.append('graham')
queue.popleft()
queue.popleft()
print(queue)
#输出结果:
#deque(['jack', 'terry', 'graham'])
3.列表推导式
-
列表推导式提供了从序列创建列表的简单途径。通常应用程序将一些操作应用于某个序列的每个元素,用其获得的结果作为生成新列表的元素,或者根据确定的判定条件创建子序列。
-
每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。返回结果是一个根据表达从其后的 for 和 if 上下文环境中生成出来的列表。如果希望表达式推导出一个元组,就必须使用括号。
vec = [2, 4, 6]
print([3*x for x in vec])
print([3*x for x in vec if x > 3])
print([3*x for x in vec if x < 2])
#输出结果:
#[6, 12, 18]
#[12, 18]
#[]
关于循环的技巧演示:
vec1 = [2, 4, 6]
vec2 = [4, 3, -9]
print([x*y for x in vec1 for y in vec2])
print([x+y for x in vec1 for y in vec2])
print([vec1[i]*vec2[i] for i in range(len(vec1))])
#输出结果:
#[8, 6, -18, 16, 12, -36, 24, 18, -54]
#[6, 5, -7, 8, 7, -5, 10, 9, -3]
#[8, 12, -54]
列表推导式可以使用复杂表达式或嵌套函数:
print([str(round(355/113, i)) for i in range(1, 6)])
#输出结果:
#['3.1', '3.14', '3.142', '3.1416', '3.14159']
4.嵌套列表解析
Python的列表可以嵌套。
import numpy as np
matrix = np.array([[1, 2, 3, 4],
[5, 6, 7, 8],
[9, 10, 11, 12]])
#方法一:
print([[row[i] for row in matrix] for i in range(4)])
#方法二:
transposed = []
for i in range(4):
transposed.append([row[i] for row in matrix])
print(transposed)
#方法三:
for i in range(4):
transposed_row = []
for row in matrix:
transposed_row.append(row[i])
transposed.append(transposed_row)
print(transposed)
#输出结果:
#[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
#[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
#[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
5.del 语句
- 使用 del 语句可以从一个列表中依索引而不是值来删除一个元素。这与使用 pop() 返回一个值不同。可以用 del 语句从列表中删除一个切割,或清空整个列表。
a = [-1, 1, 66.25, 333, 333, 1234.5]
del a[0]
print(a)
del a[2:4]
print(a)
del a[:]
print(a)
#输出结果:
#[1, 66.25, 333, 333, 1234.5]
#[1, 66.25, 1234.5]
#[]
也可以使用 del 删除实体变量
del a
二、元组和序列
元组由若干逗号分隔的值组成。
t = 12345, 54321, 'hello!'
print(t[0])
print(t)
u = t, (1, 2, 3, 4, 5)
print(u)
#输出结果:
#12345
#(12345, 54321, 'hello!')
#((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))
元组在输出时总是有括号的,以便于正确表达嵌套结构。在输入时可能有或没有括号,不过括号通常是必须的。
三、集合
- 集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。
- 可以用大括号({})创建集合。**注意:**如果要创建一个空集合,你必须用 set() 而不是 {} ;后者创建一个空的字典。
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket) #删除重复元素
if 'apple' in basket: #检测成员
print("True")
else:
print("False")
#输出结果:
#{'orange', 'pear', 'banana', 'apple'}
#True
a = set('abracadabra')
b = set('alacazam')
print(a)
print(b)
print(a | b)
print(a & b)
print(a - b)
#输出结果:
#{'d', 'c', 'a', 'r', 'b'}
#{'m', 'l', 'c', 'a', 'z'}
#{'d', 'm', 'l', 'c', 'a', 'r', 'b', 'z'}
#{'c', 'a'}
#{'d', 'b', 'r'}
集合也支持推导式:
a = {x for x in 'abracadabra' if x not in 'abc'}
print(a)
#输出结果:
#{'r', 'd'}
四、字典
另一个非常有用的 Python 内建数据类型是字典。
-
序列是以连续的整数为索引,与此不同的是,字典以关键字为索引,关键字可以是任意不可变类型,通常用字符串或数值。
-
理解字典的最佳方式是把它看作无序的键 =》值对集合。在同一个字典之内,关键字必须是互不相同。
-
一对大括号创建一个空的字典:{}。
tel = {'jack': 4098, 'sape': 4139}
tel['guido'] = 4127
print(tel)
print(tel['jack'])
del tel['sape']
tel['irv'] = 4127
print(tel)
print(list(tel.keys()))
if 'guido' in tel:
print("True")
else
print("False")
#输出结果:
#{'jack': 4098, 'sape': 4139, 'guido': 4127}
#4098
#{'jack': 4098, 'guido': 4127, 'irv': 4127}
#['jack', 'guido', 'irv']
#True
构造函数 dict() 直接从键值对元组列表中构建字典。如果有固定的模式,列表推导式指定特定的键值对。
a = dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
print(a)
#输出结果:
#{'sape': 4139, 'guido': 4127, 'jack': 4098}
此外,字典推导可以用来创建任意键和值的表达式词典:
print({x: x**2 for x in (2, 4, 6)})
#输出结果:
#{2: 4, 4: 16, 6: 36}
如果关键字只是简单的字符串,使用关键字参数指定键值对有时候更方便:
a = dict(sape=4139, guido=4127, jack=4098)
print(a)
print(type(a))
#输出结果:
#{'sape': 4139, 'guido': 4127, 'jack': 4098}
#<class 'dict'>
遍历技巧
在字典中遍历时,关键字和对应的值可以使用 items() 方法同时解读出来:
knights = {'gallahad': 'the pure', 'robin': 'the brave'}
for k, v in knights.items():
print(k, v)
#输出结果:
#gallahad the pure
#robin the brave
在序列中遍历时,索引位置和对应值可以使用 enumerate() 函数同时得到:
for i, v in enumerate(['tic', 'tac', 'toe']):
print(i, v)
#输出结果:
#0 tic
#1 tac
#2 toe
同时遍历两个或更多的序列,可以使用 zip() 组合:
questions = ['name', 'quest', 'favorite color']
answers = ['lancelot', 'the holy grail', 'blue']
for q, a in zip(questions, answers):
print('What is your {0}? It is {1}.'.format(q, a))
#输出结果:
#What is your name? It is lancelot.
#What is your quest? It is the holy grail.
#What is your favorite color? It is blue.
要反向遍历一个序列,首先指定这个序列,然后调用 reversed() 函数:
for i in reversed(range(1, 10, 2)):
print(i)
#输出结果:
#9
#7
#5
#3
#1
要按顺序遍历一个序列,使用 sorted() 函数返回一个已排序的序列,并不修改原值。
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for f in sorted(set(basket)):
print(f)
print(basket)
#输出结果:
#apple
#banana
#orange
#pear
#['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
Python3 模块
Python3的模块就是把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用。
模块是一个包含所有你定义的函数和变量的文件,其后缀名是 .py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。
实例:
import sys
print('命令行参数如下:')
for i in sys.argv:
print(i)
print('\n\nPython 路径为:', sys.path, '\n')
#输出结果:
#Python 路径为: ['D:\\python_project', 'D:\\python_project', 'D:\\conda\\python38.zip', 'D:\\conda\\DLLs', 'D:\\conda\\lib', 'D:\\conda', 'D:\\conda\\lib\\site-packages', 'D:\\conda\\lib\\site-packages\\win32', 'D:\\conda\\lib\\site-packages\\win32\\lib', 'D:\\conda\\lib\\site-packages\\Pythonwin']
- import sys 引入 python 标准库中的 sys.py 模块;这是引入某一模块的方法。
- sys.argv 是一个包含命令行参数的列表。
- sys.path 包含了一个 Python 解释器自动查找所需模块的路径的列表。
一、import 语句
想使用 Python 源文件,只需在另一个源文件里执行 import 语句,语法如下:
import module1[, module2[,... moduleN]
当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。
搜索路径是一个解释器会先进行搜索的所有目录的列表,如想要导入模块 test,需要把命令放在脚本的顶端:
# Filename: test.py
def print_func( par ):
print ("Hello : ", par)
return
main.py 引入 test 模块:
#导入模块
import test
# 现在可以调用模块里包含的函数了
test.print_func("Runoob")
#输出结果:
#Hello : Runoob
- 一个模块只会被导入一次,不管你执行了多少次import。这样可以防止导入模块被一遍又一遍地执行。
二、from … import 语句
Python 的 from 语句让你从模块中导入一个指定的部分到当前命名空间,语法如下:
from modname import name1[, name2[, ... nameN]]
三、from … import * 语句
把一个模块的所有内容全部导入到当前的命名空间也是可行的,只需如下声明:
from modname import *
这提供了一个简单的方法来导入一个模块中的所有项目。然而这种声明不该被过多地使用。
四、深入模块
-
模块除了方法定义,还可以包括可执行的代码。这些代码一般用来初始化这个模块。这些代码只有在第一次被导入时才会被执行。
-
每个模块有各自独立的符号表,在模块内部为所有的函数当做全局符号表来使用。
-
从另一个方面,当你确实知道你在做什么的话,你也可以通过 modname.itemname 这样的表示法来访问模块内的函数。
-
模块是可以导入其他模块的。在一个模块(或者脚本,或者其他地方)的最前面使用 import 来导入一个模块,当然这只是一个惯例,而不是强制的。被导入的模块的名称将被放入当前操作的模块的符号表中。
还有一种导入的方法,可以使用 import 直接把模块内(函数,变量的)名称导入到当前操作模块
from fibo import fib, fib2
这种导入的方法不会把被导入的模块的名称放在当前的字符表中(所以在这个例子里面,fibo 这个名称是没有定义的)
这还有一种方法,可以一次性的把模块中的所有(函数,变量)名称都导入到当前模块的字符表:
from fibo import *
这将把所有的名字都导入进来,但是那些由单一下划线(_)开头的名字不在此例。大多数情况, Python程序员不使用这种方法,因为引入的其它来源的命名,很可能覆盖了已有的定义。
五、__name__
属性
一个模块被另一个程序第一次引入时,其主程序将运行。如果我们想在模块被引入时,模块中的某一程序块不执行,我们可以用 __name__
属性来使该程序块仅在该模块自身运行时执行。
# Filename: main.py
if __name__ == '__main__':
print("程序自身在运行")
else:
print('我来自另一模块')
#输出结果:
#python main.py
#程序自身在运行
>>>import main
#我来自另一模块
说明: 每个模块都有一个 __name__
属性,当其值是 '__main__'
时,表明该模块自身在运行,否则是被引入。
说明:__name__
与 __main__
底下是双下划线, _ _ 是这样去掉中间的那个空格。
六、dir () 函数
内置的函数 dir() 可以找到模块内定义的所有名称。以一个字符串列表的形式返回:
import test
print(dir(test))
#输出结果:
#['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'print_func']
如果没有给定参数,那么 dir() 函数会罗列出当前定义的所有名称:
print(dir())
#输出结果:
#['__annotations__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'test']
七、标准模块
- Python 本身带着一些标准的模块库,在 Python 库参考文档中将会介绍到。
- 有些模块直接被构建在解析器里,这些虽然不是一些语言内置的功能,但是他却能很高效的使用,甚至是系统级调用也没问题。
- 这些组件会根据不同的操作系统进行不同形式的配置,比如 winreg 这个模块就只会提供给 Windows 系统。
- 应该注意到这有一个特别的模块 sys ,它内置在每一个 Python 解析器中。
>>> import sys
>>> sys.ps1
'>>> '
>>> sys.ps1 = 'C>'
C>print('Runoob!')
Runoob!
八、包
- 包是一种管理 python 模块命名空间的形式,采用 “点模块名称”。
- 比如一个模块的名称是 A.B, 那么他表示一个包 A中的子模块 B 。
- 就好像使用模块的时候,你不用担心不同模块之间的全局变量相互影响一样,采用点模块名称这种形式也不用担心不同库之间的模块重名的情况。
- 不妨假设你想设计一套统一处理声音文件和数据的模块(或者称之为一个"包")。
- 现存很多种不同的音频文件格式(基本上都是通过后缀名区分的,例如: .wav,:file:.aiff,:file:.au,),所以你需要有一组不断增加的模块,用来在不同的格式之间转换。
- 并且针对这些音频数据,还有很多不同的操作(比如混音,添加回声,增加均衡器功能,创建人造立体声效果),所以你还需要一组怎么也写不完的模块来处理这些操作。
这里给出 一种可能的包结构(在分层的文件系统中):
sound/ 顶层包
__init__.py 初始化 sound 包
formats/ 文件格式转换子包
__init__.py
wavread.py
wavwrite.py
aiffread.py
aiffwrite.py
auread.py
auwrite.py
...
effects/ 声音效果子包
__init__.py
echo.py
surround.py
reverse.py
...
filters/ filters 子包
__init__.py
equalizer.py
vocoder.py
karaoke.py
...
在导入一个包的时候,Python会根据 sys.path 中的目录来寻找这个包中包含的子目录。
- 目录只有包含一个叫做
__init__
.py 的文件才会被认作是一个包,主要是为了避免一些滥俗的名字(比如叫做 string)不小心的影响搜索路径中的有效模块。 - 最简单的情况,放一个空的 :file:
__init__
.py就可以了。当然这个文件中也可以包含一些初始化代码或者为(将在后面介绍的)__all__
变量赋值。
用户可以每次只导入一个包里面的特定模块,比如:
import sound.effects.echo
这将会导入子模块:sound.effects.echo。 但必须使用全名去访问:
sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)
还有一种导入子模块的方法是:
from sound.effects import echo
这同样会导入子模块: echo,并且他不需要那些冗长的前缀,所以他可以这样使用:
echo.echofilter(input, output, delay=0.7, atten=4)
还有一种变化就是直接导入一个函数或者变量:
from sound.effects.echo import echofilter
同样的,这种方法会导入子模块: echo,并且可以直接使用他的 echofilter() 函数:
echofilter(input, output, delay=0.7, atten=4)
注意当使用 from package import item 这种形式的时候,对应的 item 既可以是包里面的子模块(子包),或者包里面定义的其他名称,比如函数,类或者变量。
import 语法会首先把 item 当作一个包定义的名称,如果没找到,再试图按照一个模块去导入。如果还没找到,抛出一个 :exc:ImportError 异常。
反之,如果使用形如 import item.subitem.subsubitem 这种导入形式,除了最后一项,都必须是包,而最后一项则可以是模块或者是包,但是不可以是类,函数或者变量的名字。
从一个包中导入 *
Python 会进入文件系统,找到这个包里面所有的子模块,然后一个一个的把它们都导入进来。
但这个方法在 Windows 平台上工作的就不是非常好,因为 Windows 是一个不区分大小写的系统。
在 Windows 平台平台上,我们无法确定一个叫做 ECHO.py 的文件导入为模块是 echo 还是 Echo,或者是 ECHO。
为了解决这个问题,我们只需要提供一个精确包的索引。
导入语句遵循如下规则:如果包定义文件 __init__
.py存在一个叫做 __all__
的列表变量,那么在使用 from package import * 的时候就把这个列表中的所有名字作为包内容导入。