python语言程序设计是啥-Python语言程序设计知识点整理

第六周

6.1 集合类型及操作

1.集合类型的定义

集合是多个元素的无序组合,每个元素唯一,不存在相同元素。集合元素不可更改,不能是可变数据类型。这是因为,若集合元素可以改变,那么万一改变成和其它元素重复的,必然造成错误。

集合用大括号{}表示,元素之间用逗号分隔。建立集合类型有{}或set()。如果建立空集合,必须用set()。例如:

结果是:{"python’,123,("python’,123)}

结果是{"1’,’p’,’2’,’3’,’y’}

2.集合操作符

集合间操作主要有:

(1)并:S|T

(2)差:S-T

(3)交:S&T

(4)补:S^T

表1.1 6个操作符

表1.2 4个增强操作符

3.集合处理方法

表1.3 集合处理方法

6.2 序列类型及操作

1.序列类型的定义

序列是具有先后关系的一组元素。它是一维元素向量,元素类型可以不同;类似数学元素序列s0,s1,…,sn-1。元素间由序号引导,通过下标访问序列的特定元素。

序列是一个基类类型。序列衍生出:字符串类型、元组类型、列表类型。

2.序列处理函数及方法

基本之前都讲过,这里只讲下面几个:

s.index(x)或s.index(x,i,j):返回s从i开始到j位置(省略i和j则是整个序列)中第一次出现x的位置。

s.count(x):是中出现x的总次数。

3.元组类型及操作

元组是一种序列类型,但是它一旦被创建就不能修改。元组使用小括号()或者tuple()创建,元素之间用逗号分隔。在使用的时候,可以使用或不使用小括号。

4.列表类型及操作

元组是一种序列类型,但是它创建后能修改。它使用方括号[]或list()创建,元素用逗号分隔。可以使用或不使用小括号。

表2.1 列表类型操作函数和方法

5.序列类型典型应用场景

元组用于元素不改变的应用场景,更多用于固定搭配场景;列表更加灵活,它最常用的序列类型。

6.3 实例9:基本统计值计算

例:计算一组数据的总个数、总和、平均数、方差、中位数。

代码:

6.4 字典类型及操作

1.字典类型定义

字典类型是映射的体现,它通过键值对来体现,键是数据索引的扩展,字典是键值对的集合,键值对之间无序。采用大括号{}和dict()创建,键值对用冒号表示。例如:

输入

结果是

如果我们想生成一个空字典,则可以是使用

de={}

直接用大括号只能生成字典!

2.字典处理函数及方法

表4.1 字典类型操作函数和方法

6.5 模块5:jieba库的使用

jieba是优秀的中文分词第三方库。jieba分词有三种模式:精确模式、全模式、搜索引擎模式。

精确模式:把文本精确的分开,不存在冗余单词。

全模式:把文本中所有可能的词语都扫描出来,有冗余。

搜索引擎模式:在精确模式基础上,对长词再次切分。

表5.1 jieba库常用函数

6.6 实例10:文本词频统计

1.Hamlet词频统计:

2. 《三国演义》人物出场统计(下)(含《三国演义》原文文本)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值