python mean函数_python数据分析学习——1.描述性统计分析

最新推荐文章于 2024-04-19 06:57:36 发布

weixin_39519798

最新推荐文章于 2024-04-19 06:57:36 发布

阅读量1.5k

点赞数

文章标签： python mean函数 python 如何保留计算过程中的位数 python 标准差

本文详细介绍了如何使用Python进行描述性统计分析，涉及统计库如statistics、NumPy、SciPy和Pandas。内容涵盖了均值、中位数、方差、标准差、偏度、百分位数和相关性的计算，强调了这些统计量在数据分析中的作用和计算方法。

摘要由CSDN通过智能技术生成

描述性统计分析是关于数据的描述和汇总。它使用两种主要方法：

一般在数据分析的过程中，拿到数据不会去直接去建模，而是先做描述性分析来对数据有一个大致的把握，很多后续的建模方向也是通过描述性分析来进一步决定的。那么除了在Excel/R中可以去做描述性分析。

本文将细致讲解如何使用python进行描述性分析的定量分析部分:

至于可视化的部分可以参考我之前讲解pyecharts的文章，当然后面还会介绍echarts以及ggplot2的方法。

https://docs.python.org/3/library/statistics.htmldocs.python.org

statistics - Mathematical statistics functions - Python 3.8.2rc1 documentation

statistics - Mathematical statistics functions - Python 3.8.2rc1 documentationdocs.python.org

NumPy是用于数字计算的第三方库，已针对使用一维和多维数组进行了优化。它的主要类型是称为的数组类型ndarray。该库包含许多用于统计分析的方法。

NumPy User Guidedocs.scipy.org

https://www.scipy.org/getting-started.htmlwww.scipy.org

Getting started - SciPy.org

Getting started - SciPy.orgwww.scipy.org

Pandas是基于NumPy的用于数值计算的第三方库。它擅长处理带有Series对象的带标签的一维（1D）数据和带有对象的二维（2D）数据DataFrame。

https://pandas.pydata.org/pandas-docs/stable/pandas.pydata.org

Python plotting - Matplotlib 3.1.3 documentationmatplotlib.org

首先导入所有的包

import math
import statistics
import numpy as np
import scipy.stats
import pandas as pd

创建数据

x和x_with_nan都是list。不同之处在于x_with_nan包含一个nan值。也就是空值(缺失值)，这样的数据在分析中十分常见。那么在python里，创建一个nan值可以有以下方法

float('nan')
math.nan
np.nan

当然这三种方法创建的空值都是等价的

但是真的相等吗，两个nan是不相等的，换句话说，是不可以进行比较的，这后面的故事以后再说。

接着，我们使用numpy和pandas来创建两个一维numpy arrays和pandas series

关注