目录
前言
NumPy是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库1。它是科学计算的基础包,提供了多维数组对象、各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种 API。NumPy 的功能包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数、基本统计运算和随机模拟等。
一、安装Numpy
使用 pip 安装:
打开命令提示符或终端运行以下命令:
pip install numpy
使用 conda 安装:
如果你使用 conda,可以从默认或 conda-forge 渠道安装 NumPy:
# 创建一个环境而不是在基本环境中安装(推荐)
conda create -n my-env
conda activate my-env
# 如果你想从 conda-forge 安装
conda config --env --add channels conda-forge
# 实际安装命令
conda install numpy
二、使用函数进行简单的统计分析
当涉及到数据分析时,NumPy(Numerical Python)是一个强大的工具,它为 Python 提供了高效的数组操作和数学函数计算能力。下面是 NumPy 进行简单数据分析的方法:
1.创建数组:
使用 numpy.array() 函数从 Python 列表或其他序列类型创建数组。例如:
import numpy as np
# 创建一维数组
data = np.array([1, 2, 3, 4, 5])
# 创建二维数组(矩阵)
matrix = np.array([[1, 2, 3], [4, 5, 6]])
2.描述性统计量:
计算均值、中位数、标准差等统计量。例如:
# 计算一维数组的均值
mean = np.mean(data)
print("均值:", mean)
# 计算一维数组的中位数
median = np.median(data)
print("中位数:", median)
# 计算一维数组的标准差
std_dev = np.std(data)
print("标准差:", std_dev)
3.排序和百分位数:
对数组进行排序,计算百分位数。例如:
# 对一维数组进行排序
sorted_data = np.sort(data)
print("排序后的数组:", sorted_data)
# 计算第 25% 和 75% 的百分位数
percentiles = np.percentile(data, [25, 75])
print("25% 和 75% 的百分位数:", percentiles)
4.改变数组形状:
使用 reshape
方法改变数组的形状。例如:
# 将一维数组改为二维数组
reshaped_matrix = data.reshape(1, 5)
print("改变形状后的数组:", reshaped_matrix)
5.随机数组:
创建随机数组,用于模拟随机数据。例如:
# 创建一个 3x3 的随机数组
random_matrix = np.random.rand(3, 3)
print("随机数组:", random_matrix)
三、常用的统计函数
创建数组 | array() |
创建等差数列数组 | arange() |
创建等差数列 | linspace() |
创建一个全为0的数组 | zeros() |
创建一个全为1的数组 | ones() |
创建一个全空的数组 | empty() |
随机数组 | random.rand() |
中位数 | median() |
方差 | var() |
标准差 | std() |
最小值 | min() |
最大值 | max() |
分位数 | percentile() |
arr = np.array([1, 2, 3, 4, 5])
numpy.array() #创建一个数组。
numpy.arange() #创建一个等差数列数组。
numpy.linspace() #创建一个等差数列。
numpy.zeros() #创建一个全为 0 的数组。
numpy.ones() #创建一个全为 1 的数组。
numpy.empty() #创建一个全空的数组。
numpy.random.rand() #创建随机数组。
numpy.median() #计算数组的中位数。
numpy.var() #计算数组的方差。
numpy.std() #计算数组的标准差。
numpy.min() #计算数组的最小值。
numpy.max() #计算数组的最大值。
numpy.percentile() #计算数组的分位数。
在NumPy中,有许多可以用于统计分析的函数。 常见的统计函数有sum、mean、std、var、min和max等。 几乎所有的统计函数在针对二维数组计算的时候都需要注意轴的概念。 当axis参数为0时,表示沿着纵轴进行计算;当axis为1时,表示沿着横轴进行计算。 默认情况下,函数并不按照任一轴向计算,而是计算一个总值。 聚合计算将直接显示计算的最终结果,在NumPy中,cumsum函数和cumprod函数采用不聚合计算,产生一个由中间结果组成的数组。
四、 总结
本文主要介绍了NumPy数组对象ndarray的创建、生成随机数的方法、数组的索引和数组形态的变换方法。 同时还介绍了矩阵的创建方法、使用通用函数对数组进行计算。 最后介绍了利用NumPy读写文件以及进行统计分析的常用函数,为后面真正进入数据分析课程内容的学习和学习其他数据分析库(如pandas)打下坚实的基础
参考文献:【利用NumPy进行统计分析】-csdn博客