数据挖掘之统计方法

  1. 统计学是一门收集、组织数据并从这些数据集中得出结论的科学,描述和组织数据集的一般特性是描述性统计学的主题领域,而怎样从这些数据中退出结论是统计推理的主题
  2. 统计判断
    在统计分析中观测到的所有值,不管其数量是有限还是无限,都称为总体,这个术语适用于任何统计对象,总体中观测值的数量称为总体的大小,一般来说,总体可能是无限的或有限的,但由于一些有限的总体太大,理论上,就把他们假定为无限的
    根据已知的数据集,可以建立总体的统计模型,来帮助对总体作判断,如果取样过程中得出的推断总是高估或低估总体的某个特性,就称之为偏向,,为了消除取样过程中的偏向的可能性,最好是在独立、随机的观察值中选取一个随机的数据集,选取随机样本的主要目的是得到未知总体参数的信息
  3. 统计判断理论包括一些能够哦对总体进行推断和归纳的方法,这些方法分为两大类:估计和假设检验
    A:在估计中,为了估计系统的未知参数,需要给出一个置信度或一个置信空间,目的是从数据集中获得信息,来估计现实世界系统模型的一个或多个参数
    X*=X-Y,如果Y是数值,就称为回归,如果Y是离散、无序的数据集,就称为分类
    B: 在统计检验中,根据对数据集的分析来判断接受还是拒绝对总体特性值的假设,统计假设是关于一个或多个总体的断言或推测,除非检测了整个总体,否则不能完全肯定一个统计假设的真假,当然,在多数情况下,这是不切实际的,甚至是不可能的,所以可以根据随机选取的数据集来检验假设的真假,如果从这些数据集中得出的结果与原假设不一致,就拒绝这个假设,如果得出的证
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值