python统计分析常用基础知识总结(python数据分析师必备)

本文总结了Python统计分析的基础知识,包括描述性统计、统计量如均值、标准差、中位数等,以及点估计、区间估计等概念。通过中心极限定理探讨样本均值的正态分布特性,并提供了使用Python实现这些统计函数的初步步骤。
摘要由CSDN通过智能技术生成

基本的统计学概念

描述性统计分析

统计量

  • 均值 --表示一种数据集中趋势的量数

  • 标准差 --反应数据的离散程度,数据平均值的分散度量

  • 中位数 --一种不受极大值极小值影响、衡量集中趋势的办法

  • 分位数-- 将一个随机变量的概率分布范围分为几个等份的数值点

  • 众数 – 统计分布上具有明显集中趋势点的数值

  • 极差 —数据的最大值-数据的最小值 反应变量分布的离散程度

  • 四分位差 --上四分位差-下四分位差 反应中间50%数据的离散程度

  • 方差–标准差的平方,反映数据离散程度的度量

  • 变异系数 --数据的标准差/数据的均值 消除度量和量纲的影响,比较不同数据的离散程度

  • 点估计 一种估计方式 用样本统计量去估计总体

  • 区间估计 90%的可能性确定增长率在区间3%到5%,3%到5%是置信区间, 90%是置信度
    在这里插入图片描述

记一个结论:
样本均值近似正太分布。多次对数据抽样,产生的多个样本均值服从正态分布。若样本数量足够大,产生的均值是近似符合正态分布的。

中心极限定理:
设从均值μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为α/√n的正态分布。

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值