自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 泛统计理论初探——数据清洗常见技巧

统计学习-数据清洗常见技巧数据清洗的常见技巧探究在本文中,将会介绍数据清洗中的常见技巧,主要是针对在真实场景中的数据处理,比如数据竞赛、数据报告、商业分析等。数据清洗是在获取到数据后的重要步骤,通常经过清洗后的数据是可以被用于进行分析和挖掘的,而在清洗之前的数据是所谓的脏数据。常见的脏数据中,可能存在数据冗余、数据缺失、数据异常等现象。因此本文将会从上述三个角度去分析,当遇到这些问题时,应该如...

2019-11-30 12:38:57 583

原创 泛统计理论初探——分位数与箱型图

统计学习-分位数与箱型图认识分位数和箱型图在之前的文章中,我们介绍了基本的描述性统计变量,即低阶和高阶的描述性指标,比如均值、中位数、标准差、偏度、峰度等指标。在本文中,我们将介绍箱型图和分位数的含义以及应用,理解箱型图的构成和分位数的意义可以加深对数据分布的理解。首先我们介绍分位数这个指标,分位数从直观上理解就是某个样本在数据总体中的位置。要求解分位数必须对数据按某种维度进行排序,然后对排...

2019-11-22 22:58:14 1106

原创 泛统计理论初探——高阶描述统计指标

统计学习-高阶统计指标再谈描述性统计指标在上一篇文章中,我们探讨了一些最常见的统计指标:比如中位数,平均数,众数等指标。其实上一篇文章讨论的都是一阶的统计指标,即根据当前的数据能够直接计算或观察得到的指标,这种一阶指标不需要再借助其他指标去做进一步计算的。那么既然有一阶指标,就会有二阶的指标以及高阶的指标。因此在本文中,我们将会介绍几种高阶的统计指标,并阐述如何在实际情况中去使用这些指标,从而...

2019-11-16 20:57:03 1001

原创 泛统计理论初探——浅谈基本统计指标

统计学习-基本统计指标浅谈描述性统计指标在我们对统计最早的认知中,描述性统计是我们最早接触的概念,甚至有些概念在小学就有学到。常见的统计描述指标比如:平均数、众数、中位数、方差、标准差、变异系数、偏度、峰度。理解这些指标对于初学者学习统计和理解数据都大有帮助。从传统的结构型数据来看,其实数据类型有四种:定类数据、定序数据、定距数据、定比数据。为了方便解释上述描述性指标,我们在下文中使用的数据...

2019-11-07 21:37:47 691

原创 泛统计理论初探——集成学习之Bagging方法探讨

数据挖掘-探讨Bagging方法浅谈装袋方法在传统分类问题中,我们通常使用基本的分类器去得到模型,比如朴素贝叶斯模型、决策树方法、logistic模型等。但这些基本的分类器的预测正确率都是较为一般的,在处理实际问题中,这些模型的准确率可能在70%~85%之间。如果还想进一步提高预测准确率的话,可以选择使用深度学习的神经网络预测或是集成学习的方法进行预测。在某些问题上,如图像分类问题、语音识别...

2019-11-01 21:53:39 855

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除