[MySQL数据库学习] 二

1.数据库表的设计

ER图

  • Entity Relationship Diagram 实体关系图

  •     实体:矩形框 ---> 表
    
  •     属性:椭圆框 ---> 列(字段、属性、特征)
    
  •     关系:菱形框
    
  •     重数
    
    • 一对一(1:1)
    • 一对多(1:n)
    • 多对多(m:n)

EER图

  • Extended ER图
正向工程
  • 先设计EER图,然后根据EER图生成数据库和表。
反向工程
  • 用设计好的数据库和表生成EER图。

2.统计学

2.1描述型统计

  • 特点:能拿到全量数据

  • 集中趋势:均值、中位数、众数

  • 趋势

    • 极差(ptp)

      • 最大值减最小值后所得的数据
      • 极差是标志值变动的最大范围,它是测定标志变动的最简单的指标。
      • 极差不能用作比较,因为极差的单位不同,但是方差能用作比较,因为都是个比率。
    • 方差

      • 方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量
      • 是每个样本值与全体样本值的平均数之差的平方值的平均数。
    • 标准差

      • 标准差是方差的算术平方根。
      • 标准差在概率统计中最常使用作为统计分布程度,还能反映一个数据集的离散程度。
      • 平均数相同的两组数据,标准差未必相同。
  • 相关性

    • 协方差

    • 相关系数 转载: Pearson, Spearman, Kendall 三大相关系数简单介绍.

      • Spearman

        • 经常用希腊字母ρ表示。

        • 利用单调方程评价两个统计变量的相关性

        • 斯皮尔曼相关系数表明X(独立变量)和Y(依赖变量)的相关方向

          • 如果当X增加时,Y趋向于增加,斯皮尔曼相关系数则为正
          • 如果当X增加时,Y趋向于减少,斯皮尔曼相关系数则为负
          • 如果X增加时,Y没有任何趋向性,斯皮尔曼相关系数为零
      • Pearson

        • 衡量两个数据集合是否在一条线上面
        • 衡量定距变量间的线性关系
        • pearson 描述的是线性相关关系,取值[-1, 1]。负数表示负相关,正数表示正相关。在显著性的前提下,绝对值越大,相关性越强。绝对值为0, 无线性关系;绝对值为1表示完全线性相关。
      • Kindall

        • 有序分类变量
        • 等级相关系数
        • 排序一致,则为1, 排序完全相反则为-1

2.2推断型统计

  • 用样本推断总体

  • t检验和F检验

    • 样本的均值和方差能不能代表总体的均值和方差
  • 方差分析

    • 检查数据的改变是否是随机波动造成的,是否具体显著性

3.查询数据

查询语句标准格式

select ..., ..., ... 
from ..., ...
where ... and ... or ...
group by ..., ...
having ... 
order by ... asc, ... desc 

常用聚合函数

  • sum / avg / min / max / count / stddev / variance

XMind - Trial Version

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

许愿明天过一面!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值