集合类型及操作
- 定义
- 用 { } 或者 set() 来初始化,建立空集的话,必须使用set()函数
- 集合中的元素必须是不可重定义类型(int, float, 元组, 集合)
- 集合之间无序,且不存在相同元素
- 操作
- 集合应用场景
-
包含关系
-
数据去重
序列类型及其操作
序列包括字符串,元组,列表
序列的基本操作
元组
- 元组是不可修改类型
- 使用 () 或 tuple() 来初始化一个元组,也可以不使用 () 来初始化元组
列表
- 列表是可修改类型
- 用 [] 或 list() 来初始化一个列表
列表的操作
####列表的排序方法
#dict是一个字典,第一段代码的含义是将dict这个字典转换成列表
items = list(dict.items())
#使用第二列作为进行排序
items.sort(key=lambda x:x[1], reverse=True)
总结:当列表中的元素是组合数据类型时,可以采用lambda的方式选择使用那一项对列表的所有元素进行排列。排列时默认使用从小到大进行排列,reverse=True表示排列使用从大到小进行排列。
异同点
元组不可修改所以可以用在数据保护中,而列表可以对数据进行灵活的操作。
字典类型及操作
- 用大括号 { } 或 dict() 来初始化一个字典
- 值 = 字典变量[键] 字典变量[键] = 值
操作
jieba库的使用
- jieba库是一个优秀的中文分词的第三方库
- pip install jieba