目录
-
集合类型及操作
-
集合类型的定义
- 集合是多个元素的无序组合
- 集合用{}表示,元素之间用逗号分隔
- 建立集合类型用{}或set函数
- 建立空集合类型,必须用set函数
- 例子
- 特性
- 唯一性 无序性
- 集合是多个元素的无序组合
-
集合操作符
- 集合间操作
- 六个操作符
- 四个增强操作符
- 例子
- 集合间操作
-
集合处理方法
- 操作函数
- 操作函数
-
集合类型运用场景
- 数据去重
-
-
序列类型及操作
-
序列类型定义
- 序列是具有先后关系的一组元素
- 序列是一维元素向量,元素类型可以不同
- 元素间由下标号引导
- 序列是一个基类类型
- 序号的定义
- 序列是具有先后关系的一组元素
-
序列处理函数及方法
- 六个操作符
- 五个函数或方法
- 六个操作符
-
元组类型及操作
- 元组是序列类型的一种扩展
- 一旦创建就不能被修改
- () or tuple()创建 元素间用逗号分隔
- 元组可以不用括号
- return 1,2
- 元组类型操作
- 元组是序列类型的一种扩展
-
列表类型及操作
- 列表是序列类型的一种扩展
- 创建后可以被修改
- 用方括号[]或list()创建 元素间用逗号分隔
- 无长度限制
- 列表类型操作
- 列表函数方法
- 例子
- 列表操作函数方法
- 列表是序列类型的一种扩展
-
序列类型应用场景
- 元组用于元素不改变的应用场景
- 列表更加灵活
-
-
实例9:基本统计值计算
- 基本统计值
- 总个数 求和 平均数 方差 中位数
- 代码
-
def getNum(): nums=[] iNumStr = input("请输入数字") while iNumStr !="": nums.append(eval(iNumStr)) iNumStr = input("请输入数字") return nums def mean(numbers): s=0.0 for num in numbers: s=s+num return s/len(numbers) def dev(numbers,mean): sdev=0.0 for num in numbers: sdev=sdev+(num-mean)**2 return pow(sdev/(len(numbers)-1),0.5) n=getNum() m=mean(n) print("平均值:{}方差{}".format(m,dev(n,m)))
-
- 基本统计值
-
字典类型及操作
-
字典类型定义
- 映射
- 映射是一种键(索引)和值(数据)的对应
- 字典类型是映射的体现
- 键值对:键是数据索引的扩展
- 字典是键值对的集合,键值对之间无序
- 用大括号{}和dict()创建,键值用冒号:表示
- 在字典变量中,通过键获得值
- 映射
-
字典处理函数及方法
- 函数方法
- 函数方法
-
字典类型应用场景
- 映射表达
- 映射无处不在,键值对无处不在
- 表达键值对数据,进而操作它们
- 映射表达
-
-
模块5:jieba库的使用
- jieba库安装
- pip install jieba
- 三种模式
- 精准模式
- 把文本精准切分开,不存在冗余单词
- 全模式
- 把文本中所有可能的词语扫描出来,有冗余
- 搜索引擎模式
- 在精准模式基础上,对长词再次切分
- 精准模式
- 函数
- jieba库安装
-
实例10:文本词频统计
-
-
def getText(): txt = open("hamlet.txt","r").read() for ch in "!@#$%^&*:": txt = txt.replace(ch, " ") return txt hamletTxt = getText() words = hamletTxt.split() counts = {} for word in words: counts[word] = counts.get(word,0)+1 items = list(counts.items()) items.sort(key=lambda x:x[1],reverse=True)
-