numpy和pandas总结
numpy
Numpy是python中最有用的工具之一。它可以有效地处理大容量数据。使用NumPy的最大原因之一是它有很多处理数组的函数。
重点就是对数组的处理:数组的创建,数组的操作,数组内部数据的替换,两数组数据的比较,数组的计算。
对于线性代数的矩阵运算,也可以通过numpy完成。
矩阵的加减乘除,都可以通过numpy创建的数组来完成。
数组的创建
numpy.array(object, dtype=None, *,
copy=True, order='K', subok=False, ndmin=0,
import numpy as np
np.array([1,2,3,4,5])
数组的计算
arr = np.array([1,1,2,3,3,4,5,6,6,2])
np.min(arr)#求最小元素
资源汇总:https://zhuanlan.zhihu.com/p/562082459
pandas
统计汇总函数:完成一些基础计算,如最大最小均值等。
数据清洗:
判断序列元素是否重复或缺失,删除重复值或缺失。
判断数据类型,并对数据进行强制转化。
数据筛选:
绘图与元素级函数。
时间序列函数:对数据进行抽取或判断
优点:性能高,计算速度更快,底层是C语言,要比python处理数据更快。
作用盘点:
1、Pandas是Python的一个数据分析包,该工具为解决数据分析任务而创建。
2、Pandas纳入大量库和标准数据模型,提供高效的操作数据集所需的工具。
3、Pandas提供大量能使我们快速便捷地处理数据的函数和方法。
4、Pandas是字典形式,基于NumPy创建,让NumPy为中心的应用变得更加简单。