python mean函数_python数据分析学习——1.描述性统计分析

本文详细介绍了如何使用Python进行描述性统计分析,涉及统计库如statistics、NumPy、SciPy和Pandas。内容涵盖了均值、中位数、方差、标准差、偏度、百分位数和相关性的计算,强调了这些统计量在数据分析中的作用和计算方法。
摘要由CSDN通过智能技术生成

描述性分析

描述性统计分析是关于数据的描述和汇总。它使用两种主要方法:

  1. 定量方法以数值方式描述和汇总数据。
  2. 可视化方法通过图表,曲线图,直方图和其他图形来说明数据。

一般在数据分析的过程中,拿到数据不会去直接去建模,而是先做描述性分析来对数据有一个大致的把握,很多后续的建模方向也是通过描述性分析来进一步决定的。那么除了在Excel/R中可以去做描述性分析。

本文将细致讲解如何使用python进行描述性分析的定量分析部分:

  • 均值
  • 中位数
  • 方差
  • 标准差
  • 偏度
  • 百分位数
  • 相关性

至于可视化的部分可以参考我之前讲解pyecharts的文章,当然后面还会介绍echarts以及ggplot2的方法。

涉及到的python库

  • Python statistics是用于描述性统计信息的内置Python库。如果您的数据集不是太大,或者您不能依赖于导入其他库,则可以使用它。
https://docs.python.org/3/library/statistics.html​docs.python.org

statistics - Mathematical statistics functions - Python 3.8.2rc1 documentation

statistics - Mathematical statistics functions - Python 3.8.2rc1 documentation​docs.python.org
  • NumPy是用于数字计算的第三方库,已针对使用一维和多维数组进行了优化。它的主要类型是称为的数组类型ndarray。该库包含许多用于统计分析的方法。
NumPy User Guide​docs.scipy.org
  • SciPy是基于NumPy的用于科学计算的第三方库。与NumPy相比,它提供了其他功能,包括scipy.stats统计分析。
https://www.scipy.org/getting-started.html​www.scipy.org

Getting started - SciPy.org

Getting started - SciPy.org​www.scipy.org
  • Pandas是基于NumPy的用于数值计算的第三方库。它擅长处理带有Series对象的带标签的一维(1D)数据和带有对象的二维(2D)数据DataFrame
https://pandas.pydata.org/pandas-docs/stable/​pandas.pydata.org
  • Matplotlib是用于数据可视化的第三方库。通常会与NumPy,SciPy和Pandas结合使用
Python plotting - Matplotlib 3.1.3 documentation​matplotlib.org

开始

首先导入所有的包

import math
import statistics
import numpy as np
import scipy.stats
import pandas as pd

创建数据

141bd545028a43cb9ff12a8f6f857170.png

xx_with_nan都是list。不同之处在于x_with_nan包含一个nan值。也就是空值(缺失值),这样的数据在分析中十分常见。那么在python里,创建一个nan值可以有以下方法

float('nan')
math.nan
np.nan

当然这三种方法创建的空值都是等价的

24ea937f54be64ef8c90f9bac30d3252.png

但是真的相等吗,两个nan是不相等的,换句话说,是不可以进行比较的,这后面的故事以后再说。

ca59a2d872cfaeda0b55185063377fe2.png

接着,我们使用numpy和pandas来创建两个一维numpy arrays和pandas series

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值