组合数据类型
一、概述
根据数据的关系,组合数据类型分为三类,即序列类型、集合类型、映射类型
- 序列类型:元素向量,有序,可以有重复元素,通过序号访问;常见的有列表(中括号)、元组、字符串
- 集合类型:元素集合,元素无序,不重复
- 映射类型:每个元素都是一个键值对
二、序列类型
2.1 列表
1.定义:列表包含0或多个对象引用的有序序列,长度和内容可变,包含的元素类型可以不同,没有长度限制,使用灵活,每创建一个列表,python的解释器在运行代码的时候会在内存中开辟一块空间。
2.语法格式:列表名=[元素1,元素2...]
3.基本访问练习:
(1)基本访问
(2)多维列表
(3)步长访问
4.列表的操作
1.range函数生成一个有序列表,左闭右开,默认从0开始,步长默认为1。因此可以使用list来将其转换输出。
2.列表排序:
- 对于可迭代对象的排序:sorted函数:默认升序,如果降序,则加reverse参数。
sorted([3,6,7,2],reverse=True)
- 直接对列表对象排序:列表名.sort()
3.遍历列表
vlist = [0,'lists',789,'python',6]
for e in vlist:
print(e,end=' ')
2.2 元组
1.定义:序列类型,元素有序,下标访问,一旦创建则不能修改,采用圆括号或者无括号+逗号表示;并且可以嵌套元组。
2.示例以及访问:
3.元组的操作
1.**删除元组:**元组中的元素值不能单独被修改和删除,但是可以del直接删除整个元组。
2.3 字符串
1.定义:特殊列表,三引号,双引号,单引号括起来。
2.常用操作:
3.使用举例:
三、集合
1.定义:无序且不含重复元素的序列,主要用来进行成员关系测试和删除重复元素,用大括号或者set()函数进行创建。
2.集合的运算:与数学上的运算类似
3.集合的函数使用:
- 新建函数set()
- 增加元素值:add()增加一个元素值,update()增加多个元素值,参数为列表
- 删除一个元素:remove()删除集合中的元素,该元素在几个中一定要有,不然报错;discard()删除集合中的一个元素,该元素不一定在集合中,不报错
- 随机删除函数:pop(),集合为空时调用则报错
- 清空函数:clear() 将集合全部清空
- 测试两个集合是否为包含关系:s1.issubset(s2)与运算符操作“s1<=s2”类似;s1.issuperset(s2)与“s1>=s2”类似
集合使用如下:
四、字典
1.定义字典:通过字典实现映射,使用大括号,键值对之间使用冒号,不同键值对之间用逗号隔开。字典是集合的延续,元素之间没有顺序之分,乱序。最主要用来查找,通过键来找值,使用字典名配合中括号,中括号中是键。
2.字典常用的内置函数:
3.键值对的使用
五、jieba库的使用
1.jieba库是优秀的中文分词第三方库
2.分词原理:
- 利用中文词库确定汉子之间的关联概率
- 汉字之间概率大的组成词组,形成分词结果
- 除了分词,用户还可以添加自定义词组
3.分词的三种模式: - 精确模式:把文本精确的切分开,不存在多余的单词
- 全模式:把文本中所有可能的词语都扫描出来
- 搜索引擎模式:在精确的基础上,对长词进行再次划分
4.jieba库中常用函数
5.jieba库的使用