数据分析
文章平均质量分 51
VictorYao_117
一个大龄IT男
展开
-
Superset离线安装
安装前准备下载superset安装supersetSuperset官方文档给出的安装方法为在线安装,但是在实际环境中一般很难具备这样的条件,故在此分享一下我在linux环境下离线安装superset的步骤安装前准备 参照官方文档准备环境,可参考我的另一篇博文:Superset 安装和配置中第一、二步,分别准备基础环境和Virtualenv、setup tools、pip等参照上述文档,执行原创 2017-01-22 12:00:43 · 5784 阅读 · 3 评论 -
深入浅出-统计学(1)
最近开始学习《深入浅出-统计学》,在此记录一下学习笔记。第一章:信息图形化术语:1.频数:表示在一个特定组,或者说在一个特定区间内的统计对象的数目,类似于数数2.类别数据(定性数据)、数值型数据(定量数据)3.累积频数:累加到某个数值为止的总频数,基本上是所有频数的累积总和。要点:频数是一种统计方法,用于描述一个类别中有多少个项。饼图能很好的原创 2017-03-15 10:15:29 · 1599 阅读 · 0 评论 -
深入浅出-统计学(2)
第二章:集中趋势的度量术语:1.均值:将所有数字加起来,然后除以数字个数。但是这不等于平均数,因为平均数有很多种。 Σx=x1+x2+…+xn μ=Σx/n μ=Σfx/Σf(每个数字乘以其频数)/(频数和) 异常值:与其他数据格格不入的极高或极低的数值 偏斜数据:当异常值将数据向左或向右“拉”时,即产生偏斜数据2.中位数:处于中间,即原创 2017-03-16 10:20:16 · 810 阅读 · 0 评论