python笔记------第6章 组合数据类型

目录

集合类型及操作

集合类型的定义

集合操作符

集合处理方法

集合类型运用场景

序列类型及操作

序列类型定义

序列处理函数及方法

元组类型及操作

列表类型及操作

序列类型应用场景

实例9:基本统计值计算

字典类型及操作

字典类型定义

字典处理函数及方法

字典类型应用场景

模块5:jieba库的使用

实例10:文本词频统计


  • 集合类型及操作

     

    • 集合类型的定义

      • 集合是多个元素的无序组合
        • 集合用{}表示,元素之间用逗号分隔
        • 建立集合类型用{}或set函数
        • 建立空集合类型,必须用set函数
      • 例子 
      • 特性
        • 唯一性 无序性
    • 集合操作符

      • 集合间操作
        • 六个操作符
        • 四个增强操作符
      • 例子

    • 集合处理方法

      • 操作函数
    • 集合类型运用场景

      • 数据去重

  • 序列类型及操作

    • 序列类型定义

      • 序列是具有先后关系的一组元素
        • 序列是一维元素向量,元素类型可以不同
        • 元素间由下标号引导
      • 序列是一个基类类型
      • 序号的定义
    • 序列处理函数及方法

      • 六个操作符
      • 五个函数或方法

    • 元组类型及操作

      • 元组是序列类型的一种扩展
        • 一旦创建就不能被修改
        • () or tuple()创建 元素间用逗号分隔
        • 元组可以不用括号
          • return 1,2
      • 元组类型操作
    • 列表类型及操作

      • 列表是序列类型的一种扩展
        • 创建后可以被修改
        • 用方括号[]或list()创建 元素间用逗号分隔
        • 无长度限制
      • 列表类型操作
      • 列表函数方法

        • 例子
      • 列表操作函数方法
    • 序列类型应用场景

      • 元组用于元素不改变的应用场景
      • 列表更加灵活
  • 实例9:基本统计值计算

    • 基本统计值
      • 总个数 求和 平均数 方差 中位数
    • 代码
      • def getNum():
            nums=[]
            iNumStr = input("请输入数字")
            while iNumStr !="":
                nums.append(eval(iNumStr))
                iNumStr = input("请输入数字")
            return nums
        
        def mean(numbers):
            s=0.0
            for num in numbers:
                s=s+num
            return s/len(numbers)
        
        def dev(numbers,mean):
            sdev=0.0
            for num in numbers:
                sdev=sdev+(num-mean)**2
            return pow(sdev/(len(numbers)-1),0.5)
        
        n=getNum()
        m=mean(n)
        print("平均值:{}方差{}".format(m,dev(n,m)))

  • 字典类型及操作

    • 字典类型定义

      • 映射
        • 映射是一种键(索引)和值(数据)的对应
      • 字典类型是映射的体现
        • 键值对:键是数据索引的扩展
        • 字典是键值对的集合,键值对之间无序
        • 用大括号{}和dict()创建,键值用冒号:表示
      • 在字典变量中,通过键获得值

         

    • 字典处理函数及方法

      • 函数方法
    • 字典类型应用场景

      • 映射表达
        • 映射无处不在,键值对无处不在
        • 表达键值对数据,进而操作它们
  • 模块5:jieba库的使用

    • jieba库安装
      • pip install jieba
    • 三种模式
      • 精准模式
        • 把文本精准切分开,不存在冗余单词
      • 全模式
        • 把文本中所有可能的词语扫描出来,有冗余
      • 搜索引擎模式
        • 在精准模式基础上,对长词再次切分
    • 函数
  • 实例10:文本词频统计

  •  
    • def getText():
          txt = open("hamlet.txt","r").read()
          for ch in "!@#$%^&*:":
              txt = txt.replace(ch, " ")
          return txt
      
      hamletTxt = getText()
      words = hamletTxt.split()
      counts = {}
      for word in words:
          counts[word] = counts.get(word,0)+1
      items = list(counts.items())
      items.sort(key=lambda x:x[1],reverse=True)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值