1.2.2 Numpy的使用
Numpy 简介
Numpy ( Numerical Python 的简称)是高性能科学计算和数据分析的基础包,提供了矩阵运算的功能。 Numpy 提供了以下几个主要功能:
- ndarray :一个具有向量算术运算和复杂广播能力的多维数组对象;
- 用于对数组数据进行快速运算的标准数学函数;
- 用于读写磁盘数据的工具以及用于操作内存映射文件的工具;
- 非常有用的线性代数,傅里叶变换和随机数操作;
- 用于集成 C/C+ 和 Fortran 代码的工具。
除明显的科学用途之外, Numpy 也可以用作通用数据的高效多维容器,可以定义任意的数据类型。这些特性和功能使得 Numpy 能无缝、快速地与各种数据库集成。
在处理自然语言过程中,需要将文字(中文或其他语言)转换为向量,即把对文本内容的处理简化为向量空间中的向量运算。基于向量运算,我们就可以实现文本语义相似度、特征提取、情感分析、文本分类等功能。
Numpy 的统计计算方法
Numpy 内置很多计算方法。其中最重要的统计方法有:
sum()
:计算数组元素的和;对于矩阵计算结果为一个一维数组,需要指定行或者列;mean()
:计算数组元素的平均值;对于矩阵计算结果为一个一维数组,需要指定行或者列;max()
:计算数组元素的最大值;对于矩阵计算结果为一个一维数组,需要指定行或者列。