常见数据分析work(1)

1.描述性统计

   描述性统计分析要对调查总体所有变量的有关数据进行统计性描述,主要包括数据的频数分析集中趋势分析离散程度分析分布以及一些基本的统计图形。

①数据的频数分析。在数据的预处理部分,利用频数分析和交叉频数分析可以检验异常值。

②数据的集中趋势分析。用来反映数据的一般水平,常用的指标有平均值、中位数和众数等。

③数据的离散程度分析。主要是用来反映数据之间的差异程度,常用的指标有方差和标准差。(SD)

④数据的分布。在统计分析中,通常要假设样本所属总体的分布属于正态分布,因此需要用偏度和峰度两个指标来检查样本数据    是 否符合正态分布。(QQ图,柱形图,K-S检验)

2.回归分析

利用特征来预测结果值(个人理解)。可以分为线性回归和非线性回归,个人理解为当自变量与预测值能成一种线性关系的,可使用基于线性思维的回归算法。当自变量与预测值成非线性关系的可以用基于非线性思维的回归算法

线性回归:普通的线性回归(一元 or 多元),SVR(linear),贝叶斯线性回归。

非线性回归:基于决策树的回归,SVR(RBF)。

3.方差分析

①均数差别的显著性检验

②分离各有关因素并估计其对总变异的作用

③分析因素间的交互作用

④方差齐性检验。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值