数据分析统计学原理第一章:基本概念 | 我的统计学原理复习日记

个体(element):搜集数据的实体
变量(variable):个体中所感兴趣的特征
测量值:每个个体的每一变量的值
观测值(observation):某一个体得到的测量值集合

名义尺度(nominal scale):无顺序无等级,比如:成员,非成员
顺序尺度(ordinal scale):有顺序有等级意义,数据的间隔无意义,比如:A级,B级
间隔尺度(interval scale):具有顺序数据的所有属性,且可以按某一固定度量单位表示数值间隔,比如100分,90分
比率尺度(ratio scale):具有间隔数据的所有属性,且两个数值之比有意义,必须有0值,比如100千克,50千克

分类型数据(categorical data) - 分类变量(categorical variable) - 互相计算无意义
数量型数据(quantitative data) - 数量变量(quantitative variable) - 互相计算有意义

截面数据(cross-sectional data):在相同或近似相同的时间点上搜集的数据
时间序列数据(time series data):在不同时间点上搜集的数据

描述统计(descriptive statistics):将数据以表格、图形或数值形式汇总的统计方法

总体(population):在特定研究中所有感兴趣的个体组成的集合
样本(sample):总体的一个子集

普查(censes):搜集总体全部数据的调查过程
抽样调查(sample survey)搜集样本数据的调查过程
统计推断(statistical inference):利用样本数据对总体特征进行估计和假设检验

逻辑分析方法(analytics):将数据转化为做出好决策见解的科学过程,包含描述性分析,预测性分析,规范性分析
描述性分析(descriptive analytics):包含描述过去发生状况的分析技术集合
预测性分析(predictive analytics):包含利用过去数据建立模型来预测未来或评估一个变量对另一个变量影响的分析技术
规范性分析(prescriptive analytics):产生一个最佳行动过程的分析技术的合集

大数据(big data):3V数据:容量(volume),速度(velocity),种类(variety)
数据挖掘(data mining):从非常大的数据库中开发有用的决策信息的方法

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值