python数据分析学习笔记
第三节
一、可变字符串
在python种,字符串属于不可变对象,不支持原地修改,如果修改其中的值,智能创建新的字符串对象,但是需要经常修改手册,则需要使用io.StringIo对象或者array模块
>>>import io
>>>s = "hello.exe"
>>>sio = io.StringIo(s)
>>>sio
<_io.stringIo objecct at
>>>sio.getvalue()
'hello,exe'
>>>sio.seek(7)
二、序列
序列是一种数据存储方式,用来存储一系列的数据。在内存中,序列就是一块用来存放 多个值的连续的内存空间。比如一个整数序列[100,200,300,400],可以这样示意表示
100 | 200 | 300 | 400 |
---|
注:序列存储的对象地址,不是整数对象的值
常用的序列结构有:
字符串、列表、元组、字典、集合
三、列表简介
列表:用于存储任意数目、任意类型的数据集合。
列表对象的常用方法汇总
方法 | 要点 | 描述 |
---|---|---|
list.append(x) | 增加元素 | 将元素 x 增加到列表 list 尾部 |
list.extend(aList) | 增加元素 | 将列表 alist 所有元素加到列表 list 尾部 |
list.insert(index,x) | 增加元素 | 在列表 list 指定位置 index 处插入元素 x |
list.remove(x) | 删除元素 | 在列表 list 中删除首次出现的指定元素 x |
list.pop([index]) | 删除元素 | 删除并返回列表 list 指定为止 index 处的元素,默认是 最后一个元素 |
list.clear() | 删除所有元素 | 删除列表所有元素,并不是删除列表对象 |
list.index(x) | 访问元素 | 返回第一个 x 的索引位置,若不存在 x 元素抛出异常 |
list.count(x) | 计数 | 返回指定元素 x 在列表 list 中出现的次数 |
len(list) | 列表长度 | 返回列表中包含元素的个数 |
len(list) | 列表长度 | 所有元素原地翻转 |
list.sort() | 排序 | 所有元素原地排序 |
list.copy() | 浅拷贝 | 返回列表对象的浅拷贝 |
四、列表的创建
1、基本语法[]创建
>>> a = [10,20,'hyh','lccy']
>>>> a = [] #创建一个空的列表对象
2、list()创建
>>> a = list() #创建一个空的列表对象
>>> a = list(range(10))
>>> a [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> a = list("gaoqi,sxt")
>>> a ['g', 'a', 'o', 'q', 'i', ',', 's', 'x', 't']
3、range()创建整数列表
range语法格式:range([start,] end [,step])
start 参数:可选,表示起始数字。默认是 0 end 参数:必选,表示结尾数字。 step 参数:可选,表示步长,默认为 1
py3里,range返回的是一个range对象不是列表,则需要通过list()将其转化为列表对象
list(range(15,3,-1))
>>> list(range(3,-10,-1))
[3, 5, 7, 9, 11, 13]
>>> list(range(15,3,-1))
[15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4]
>>> list(range(3,-10,-1))
[3, 2, 1, 0, -1, -2, -3, -4, -5, -6, -7, -8, -9]
4、推导式生成列表
>>> a = [x*2 for x in range(5)] #循环创建多个元素
>>> a [0, 2, 4, 6, 8]
>>> a = [x*2 for x in range(100) if x%9==0] #通过 if 过滤元素
>>> a [0, 18, 36, 54, 72, 90, 108, 126, 144, 162, 180, 198]
5、列表元素的增加和删除
列表增加和删除元素时,列表会自动进行内存管理。
6、append()方法
原地修改列表对象,是真正的列表尾部添加新的元素,速度最快
>>> a = [20,40]
>>> a.append(80)
>>> a
[20, 40, 80]
7、+运算符操作
>>> a = [20,40] >>> id(a) 46016072
>>> a = a+[50]
>>> id(a)
46015432
变量 a 的地址发生了变化,也就是创建了新的列表对象。
8、extend()方法
将目标列表的所有元素添加到本列表的尾部,属于原地操作,不创建新的列表对象
>>> a = [20,40]
>>> id(a) 46016072
>>> a.extend([50,60])
>>> id(a)
>46016072
9、insert()插入元素
>>> a = [10,20,30]
>>>a.insert(2,100)
>>> a
[10, 20, 100, 30]
10、乘法扩展
>>> a = ['sxt',100]
>>> b = a*3
>>> a ['sxt', 100]
>>> b ['sxt', 100, 'sxt', 100, 'sxt', 100] #适用于乘法操作的,还有:字符串、元组。
>>> c = 'sxt'
>>> d = c*3
>>> c
'sxt'
>>> d
'sxtsxtsxt'
11、列表元素的删除
(1)del 删除
>>> a = [100,200,888,300,400] >
>>> del a[1]
>>> a
[100,200,300,400] #删除列表指定位置的元素。
12、pop()方法
pop()删除并返回指定位置元素,如果未指定位置则默认操作列表最后一个元素
>>> a = [10,20,30,40,50]
>>> a.pop()
50
>>> a
[10, 20, 30, 40]
>>> a.pop(1)
20
>>> a
[10, 30, 40]
13、remove()方法
删除首次出现的指定元素,若不存在该元素抛出异常。
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a.remove(20)
>>> a
[10, 30, 40, 50, 20, 30, 20, 30]
>>> a.remove(100)
Traceback (most recent call last): File "<pyshell#208>", line 1, in <module> a.remove(100)
ValueError: list.remove(x): x not in list
14、列表元素访问和计数
(1)通过索引直接访问元素
可以通过索引直接访问元素
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a
[2] 30>>> a[10]
15、index()获得指定元素在列表中首次出现的索引
index()可以获取指定元素首次出现的索引位置
语法:index(value,[start,[end]]),其中start 和 end 可以指定了搜索的范围。
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a.index(20)
1
>>> a.index(20,3)
5
>>> a.index(20,3) #从索引位置 3 开始往后搜索的第一个 20
5
>>> a.index(30,5,7) #从索引位置 5 到 7 这个区间,第一次出现 30 元素的位置
6
16、count()获得指定元素在列表中出现的次数
count()可以返回指定元素在列表中出现的次数。
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a.count(20)
3
17、len()返回列表长度
len()返回列表长度,即列表中包含元素的个数。
>>> a = [10,20,30]
>>> len(a)
3
五、切片操作
切片 slice 操作可以让我们快速提取子列表或修改。标准格式为:
[起始偏移量 start:终止偏移量 end[:步长 step]]
注:
当步长省略时顺便可以省略第二个冒号
典型操作
操作和说明 | 示例 | 结果 |
---|---|---|
[:] 提取整个列表 | [10,20,30][:] | [10,20,30] |
[start:]从 start 索引开始到 结尾 | [10,20,30][1:] | [20,30] |
[:end]从头开始知道 end-1 | [10,20,30][:2] | [10,20] |
[start:end]从 start 到 end-1 | [10,20,30,40][1:3] | [20,30] |
[start:step] 从 start 提 取到 end-1,步长是 step | [10,20,30,40,50,60,70][1:6: 2] | [20, 40, 60] |
[10,20,30,40,50,60,70][-3:] | 倒数三个 | [50,60,70] |
10,20,30,40,50,60,70][-5:-3] | 倒数第五个到倒数 第三个(包头不包尾) | [30,40] |
[10,20,30,40,50,60,70][::-1] | 步长为负,从右到左 反向提取 | [70, 60, 50, 40, 30, 20, 10] |
六、列表排序
1、修改原列表,不建新列表的排序
>>> a = [20,10,30,40]
>>> id(a)
54044744
>>> a.sort() #默认是升序排列
>>> a [10, 20, 30, 40]
>>> a = [10,20,30,40] >>> a.sort(reverse=True) #降序排列
>>> a
[40, 30, 20, 10]
>>> import random
>>> random.shuffle(a) #打乱顺序
>>> a
[20, 40, 30, 10]
2、建新列表的排序
通过内置函数 sorted()进行排序,这个方法返回新列表,不对原列表做修改。
3、reversed()返回迭代器(目前了解)
内置函数 reversed()也支持进行逆序排列,与列表对象 reverse()方法不同的是,内置函数 reversed()不对原列表做任何修改,只是返回一个逆序排列的迭代器对象。
>>> a = [20,10,30,40]
>>> c = reversed(a)
>>>> c
<list_reverseiterator object at 0x0000000002BCCEB8>
>>> list(c)
[40, 30, 10, 20]
>>> list(c)
[]
4、列表相关的其他内置函数汇总
(1)max 和 min
用于返回列表中最大和最小值。
[40, 30, 20, 10]
>>> a = [3,10,20,15,9]
>>> max(a)
20
>>> min(a)
3
(2)sum
对数值型列表的所有元素进行求和操作,对非数值型列表运算则会报错。
>>> a = [3,10,20,15,9]
>>> sum(a)
57
5、多维列表
(1)二维列表
七、元组 tuple
元组支持的操作有:
1. 索引访问
2. 切片操作
3. 连接操作
4. 成员关系操作
5. 比较运算操作
6. 计数:元组长度 len()、最大值 max()、最小值 min()、求和 sum()等。
1、元组的创建
①. 通过()创建元组。小括号可以省略。
a = (10,20,30) 或者 a = 10,20,30
如果元组只有一个元素,则必须后面加逗号。这是因为解释器会把(1)解释为整数 1,(1,) 解释为元组。
>>> a = (1)
>>> type(a)
<class 'int'>
>>> a = (1,) #或者 a = 1,
>>> type(a)
<class 'tuple'>
②. 通过 tuple()创建元组
tuple(可迭代的对象)
如:
b = tuple() #创建一个空元组对象 b = tuple(“abc”)
b = tuple(range(3))
b = tuple([2,3,4])
总结:tuple()可以接收列表、字符串、其他序列类型、迭代器等生成元组。 list()可以接收元组、字符串、其他序列类型、迭代器等生成列表。
2、元组的元素访问和计数
3、zip
zip(列表 1,列表 2,…)将多个列表对应位置的元素组合成为元组,并返回这个 zip 对象。
>>> a = [10,20,30]
>>> b = [40,50,60]
>>> c = [70,80,90]
>>> d = zip(a,b,c)
>>> list(d)
[(10, 40, 70), (20, 50, 80), (30, 60, 90)]
4、生成器推导式创建元组(理解)
总结:
- 元组的核心特点是:不可变序列。
- 元组的访问和处理速度比列表快
- 与整数和字符串一样,元组可以作为字典的键,列表则永远不能作为字典的键使用。