1.Numpy基础
1.1概述
- Numpy的基本用法
import numpy as np arr = np.ones(5) print(arr) type(arr) >>>[1. 1. 1. 1. 1.]//输出是有点点的 numpy.ndarray
1.2 Numpy中的数组
1.2.1创建数组:
1.从python列表转换:将python列表传递数组函数以创建Numpy数组。
arr = np.array([1,2,3,4,5])
arr
>>>array([1,2,3,4,5]) #每个数字的结尾都有逗号
arr = np.array(range(0,6))
arr
>>>array([0,1,2,3,4,5])
2.使用Numpy内部功能函数:
arrange() : 用于快速创建一维数组
zero() : 函数创建一个填充0的数组 ones() : 创建一个填充1的数组
full() : 函数创建一个填充给定值的数组
2*(3*3):构建两个三行三列的矩阵,矩阵里面填充6
empty() :创建一个数组,它的初始内容是随机的,取决于内存的状态
eye() :创建对角线为1的数组
random() :创建一个填充0到1之间随机值的数组。
np.random.random((2,3))
#和rand,randn参数类型不同,这两个采用可变参数,而random采用元组
>>>array([[0.07558929,0.65113013,0.00673818],
[0.73596032,0.68664976,0.38539903]])
1.2.2创建向量(向量只有一列)
1.3 数组的操作
1.3.1数据类型
-
通过ndarray的dtype属性可以获取数组的数据类型;此外,在创建数组时,可以使用dtype参数来指定数组的数据类型,astype()方法也可以进行类型转换。
1.3.2 数组形状
通过数组对象的shape属性获取到形状。
resize():方法会修改数组本身
1.3.3 数组索引(?)
整数索引、整数数组(列表)索引、切片、布尔数组索引、where()函数
1.3.4 赋值、视图与拷贝(?)
赋值:不会复制数组对象或其数据
视图(浅拷贝):视图是一个新对象,但它与原数组共享数据。
拷贝(深拷贝):
2.Pandas基础
2.1概述
2.2Pandas的数据结构
2.2.1Series
是带标签的一维数组,标签又称索引。
1.创建Series对象:
data支持字典、一维数组、标量值
- 使用字典创建:
NaN表示缺失数据
- 使用一维数组创建
- 使用标量创建
2.series的使用
- 索引:支持下标索引和标签索引,也支持切片。(使用下标切片时,不包括最后一个元素,使用标签切片时,包括最后一个元素)
- 自动对齐:按标签对齐。
2.2.2DataFrame
本质上是二维表。
1.创建DataFrame
- 使用二维数组创建
- 使用series字典创建
- 使用列表字典和字典列表创建
2.查看数据
head():从头开始看
tail():从尾开始看
shape():查看DataFrame的形状
3.数据索引
- [ ]:索引运算符
- loc[ ]:基于标签进行索引,也可以与布尔数组一起使用