目录
集合类型
集合类型的定义
1.集合是多个元素的无序组合
2.集合类型与数字中的集合概念一致
3.集合元素之间无序,每个元素唯一,不存在相同元素
4.集合元素不可更改,不能是可变数据类型
5.集合用大括号{}表示,元素间用逗号分隔
6.建立集合类型用{}或set()
7.建立空集合类型必须使用set()
集合间的操作
六个基本操作符
四个增强操作符
集合操作函数
集合处理方法
可用循环遍历集合
集合使用场景
1.包含关系比较
2.数据去重“集合类型所有元素不重复
序列类型
序列类型定义
1.序列具有先后关系的一组元素
2.序列是一维元素向量,元素类型可以不同3.
3.元素间由序号引导,通过下标访问序列的特定元素
序列是一个基类类型
序列的衍生类型:字符串类型,元组类型,列表类型
序列处理函数及方法
元组类型
元组类型的定义
1.元组是一种序列类型,一旦创建就不能被修改
2.使用小括号()或tuple()创建,元素间用逗号分隔
3.可以使用或不使用小括号
元组类型操作及使用
元组的应用场景
元组用于元素不改变的应用场景,更多用于固定搭配的场景
列表类型
列表类型定义
1.列表是一种序列类型,创建后可被修改
2.使用方括号或list[]创建,元素间用逗号分隔
3.列表各元素类型可以不同,无长度限制
列表类型操作及使用
应用场景
列表更加灵活,是最常用的序列类型
最主要作用:表示一组有序数据,进而操作
字典类型
字典类型定义
1.映射是一种键(索引)和(数据)值的对应
2.字典类型是映射的体现
3.键值对:键是数据索引的拓展
4.字典是键值对的集合,键值对之间无序
5.采用大括号{}和dict()创建,键值对用冒号表示
字典类型的操作及方法
jieba库
jieba库是优秀的中文分词第三方库
三种分词模式
精确模式:把文本精确的切分开,不存在冗余单词
全模式:把文本中所有可能的词语都扫描出来,有冗余
搜索引擎模式:在精确模式基础上,对长词再次划分
常用函数