《数据科学基础》课堂笔记

数据科学基础课堂笔记

绪论

1.1 DIKW 金字塔模型

在这里插入图片描述


1.2数据类型

  • 数据最相关的是集合论,集合论被视为现代数学的基础
  • 数据类型通常可以分为四类:
    • 定类数据(最低级)
      • 代表不同的分类。相应的数据没有数量的含义。是没有顺序大小之分的较低级的数据
      • 定类数据之间的数学关系就是:等于、不等于
      • 如:使用1代表男性,0代表女性,但不代表男性比女性好
    • 定序数据
      • 定序数据是量化尺度的最基本形式,通常采用数字表示顺序
      • 定序数据不但有差别,而且有等级之分
      • 如:2表示优,1表示良,0表示差
      • 定序数据之间的数学关系:等于、不等于、大于、小于、大于等于、小于等于
    • 定距数据
      • 不仅可以将事物区分为不同类型并进行排序,而且可以准确地指出类别之间地差距是多少
      • 定距变量的数据是一种真正数量化的数值,即可以对这些数据进行±*/运算
      • 在定距变量中,0是强行规定的,它不代表完全没有的意思
    • 定比数据(最高级)
      • 在这里插入图片描述
    • (从低级到高级)
    • 在这里插入图片描述
    • 高级数据可以通过数据处理降为低级别数据

1.3数据汇总

  • 数据汇总:
    • 集中趋势度量
      • 集中趋势度量反应的是数据(样本或总体)的平均水平或数据的中心值
      • 在这里插入图片描述
      • 在这里插入图片描述
      • 在这里插入图片描述
      • 在这里插入图片描述
      • 在这里插入图片描述
        ** 利用平均数的求和稳定性,可以大大降低运算复杂度**
      • 几何平均数一般用于求增长率(每一年的增长都以上一年为基数)在这里插入图片描述
      • 在这里插入图片描述
    • 离散趋势度量
      • 研究数据的波动
      • 在这里插入图片描述
      • 在这里插入图片描述
      • 在这里插入图片描述
      • 在这里插入图片描述

概率论基础

在这里插入图片描述

古典概率

在这里插入图片描述

几何概率

(从有限到无限的集合推广)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

概率的计算

条件概率
  • 在这里插入图片描述
  • 韦恩图的解释:已知事件B发生的情况下求事件A也发生的概率,求A和B交叉部分的概率除以事件B的概率,也就是P(A&B)/P(B) :**事件A发生且事件B也发生的概率除以B的概率(因为交叉部分的概率就是P(A&B)而不是P(A)*P(B)在这里插入图片描述
  • 但要注意,:在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 完备事件组在这里插入图片描述
  • 在这里插入图片描述
  • 例题: 有一道选择题,该学生知道正确答案和不知道正确答案的概率是0.5,不知道正确答案时,该学生有1/4的概率猜对。现在知道此学生答对了这道题,求该学生知道正确答案的概率是多少
  • 在这里插入图片描述
贝叶斯公式
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
独立性
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
随机测试示例
  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值