统计学
柚子you
这个作者很懒,什么都没留下…
展开
-
数据的描述性统计
数据的描述性统计标签(空格分隔):对数据的描述性统计主要是指对结构化数据的描述分析,可从三个维度进行分析:数据的集中趋势、数据的离散程度和数据的分布形态。描述数据集中趋势的指标有:众数、中位数、平均数(包含算数平均数、加权平均数、集合平均数)和分位数。描述数据的离散程度的指标有:方差、标准差、极差和平均差(数值型数据);四分位差(顺序数据);异众比率(分类数据);离散系数 (相对离散程度)...原创 2019-07-21 17:53:05 · 3383 阅读 · 0 评论 -
数据的概率分布以及用python绘制分布图
一、基础概念先来看下数据的类型,常见的数据分类方式有三种:第一种是按照数据的结构属性分类,根据数据的存储形式分为结构化数据和非结构化数据,例如数据库的存储对象基本上都是结构化数据,结构化数据是进行数据分析的基本类型;对于非结构化数据,其存在形式多样化,有视频、音频、图片、影像、文档和文本等形式,对于非结构化数据只有将其转化为结构化数据才能进行数分析。第二种按照数据的连续性特征分为离散型数据和连续...原创 2019-08-11 22:13:42 · 22225 阅读 · 1 评论 -
常用的统计量和抽样分布
一、统计量**样本均值:**即在总体中的样本数据的均值,反映样本数据的集中趋势。样本方差:每个样本值与全体样本值平均数之差的平方值的平均数;方差是用来衡量随机变量和其数学期望(均值)之间的偏离程度。样本变异系数:变异系数又称为离散系数,定义为标准差与平均值之比,样本变异系数即样本数据的标准差与其均值之比。样本k阶中心矩:在概率论中,矩是用来描述随机变量的某些特征的数字,即求平均值;随机变量...原创 2019-08-25 23:11:05 · 4996 阅读 · 1 评论 -
用python分析数据的抽样分布
数据集:数据有四列 ID、年龄、价格、港口操作环境:jupyter notebook分析一:按照港口分类,求出各类港口数据年龄和价格的统计量(包括均值、方差、标准差、变异系数等)1.导入数据import numpy as npimport pandas as pddf=pd.read_excel("C:/../data.xlsx",index_col=0,header=0,encodi...原创 2019-09-03 19:29:22 · 952 阅读 · 0 评论 -
参数估计(点估计和区间估计)
一、点估计1.点估计就是用样本统计量来估计总体参数。概念理解:当我们想知道某一总体的某个指标的情况时,测量整体该指标的数值 的工作量太大,或者不符合实际,这时我们可以采用抽样的方法选取一部分样本测量出他们数值,然后用样本统计量的值来估计总体的情况。例如:想了解一个学校学生的身高情况,就可以随机抽取一部分学生测量他们的身高,得到一个平均值,再用这个样本的均值去估计整体学生的身高情况,就是点估计...原创 2019-09-07 12:55:38 · 55338 阅读 · 4 评论 -
假设检验1——理论基础
假设检验和区间估计都依赖于抽样分布,利用抽样分布的特性推导出区间估计和假设检验的概率公式。1.假设检验与区间估计由于假设检验与区间估计都是基于抽样分布,即基于样本抽样分布的性质去计算相应的置信区间或者比较临界值判断假设是否成立,两者相比假设检验比区间估计多了一个已知条件,即假设总体参数等于某个常数。例如,对于总体均值的区间估计和假设检验需要用到均值抽样分布(Z 分布或 T分布),如果样本容量...原创 2019-09-08 16:50:22 · 1859 阅读 · 0 评论