集合元素之间无序,每个元素唯一,不存在相同元素,集合元素不可更改,不能是可变数据元素。
A={"python","123",(13,"bakdan")} #使用{}建立一个集合
B=set("pypy123") #使用set()建立集合,建立空集合必须使用set()
B={'1','2','3','p','y'}
序列类型:具有先后关系的一组元素,元素类型可以不同,元素间由序号引导,通过下标访问序列的特定元素
序列是一种基类类型,衍生出来的有字符串类型,元组类型,列表类型,有正向递增序号和反向递减序号
元组是一种序列类型的扩展,一旦创建就不能被修改,使用小括号或tuple()创建,元素间用逗号分隔,可以使用或不使用小括号
元组继承了序列的全部通用操作
列表创建后可以被随意修改,使用方括号[]或list[],元素之间用逗号分隔,把列表赋值给别人,他们都指向同一个列表,并没有创建一个新列表
字典类型:采用大括号{}和dict()创建,键值对用冒号:表示,字典是键值对的集合,键值对之间无序,字典中的元素由键和值构成,元素间用逗号分隔
<字典变量>={<键1>:<值1>,<键2>:<值2>,...,<键n>:<值n>}
#创建一个字典,可以使用{}创建一个空字典
<字典变量>[<键>]=<值> #索引字典中键对应的值
<字典变量>[<键>]=<值>
#如果字典中没有这个键可以用这个增加字典中的键值对或者修改键对应的值
jieba库的使用,有三个模式,精确模式;把文本精确的切分开,不存在冗余单词
全模式:把文本中的所有可能的词语都扫描出来,有冗余
搜索引擎模式:在精确模式上,对长词再次切分