numpy和pandas

目录

ndarray数据的创建方法

数组的索引和切片

数组与标量之间的运算(作用于数组中的每一个元素)

numpy一元函数,对ndarray中的数据执行元素级运算的函数

nunpy中二元函数

csv文件,用逗号分隔值

nmupy中随机数函数random

numpy中的统计函数

numpy中的梯度函数

pandas是基于numpy实现的扩展库


ndarray数据的创建方法

1.从python中的列表、元组等类型创建ndarray数组

x = np.array(list/tuple)

x = np.array(list/tuple,dtype=np.float32)

当np.array()不指定dtype时,numpy将根据数据情况关联一个dtype类型。

2.使用numpy中函数创建naarray数组,如;array、ones、zeros等

其中ndarray数组的维度变换方法如下图

因此在使用的时候要注意哪些方法是改变原数组,哪些是不改变原数组的,举例如下图:

ndarray数组类型的变化方法astype(),该方法一定会创建新的数组(原始数据的一个拷贝),即使两个类型一致。

naarray数组向列表的转换方法tolist(),如下图:

3.从字节流(raw bytes)中创建ndarray数组

4.从文件中读取特定格式,创建ndarray数组。

 

数组的索引和切片

索引:获取数组中特定位置元素的过程

切片:获取数组元素子集的过程,例如 a[起始编号:终止编号(不含):步长]

多维数组的索引,举例如下:

多维数组的切片,举例如下:

 

数组与标量之间的运算(作用于数组中的每一个元素)

numpy一元函数,对ndarray中的数据执行元素级运算的函数

nunpy中二元函数

csv文件,用逗号分隔值

使用savetxt函数向csv中写入数据,具体方法如下并举例:

使用loadtxt函数从csv文件中读取数据,具体方法如下并举例:

需要注意的是csv文件只能有效的存储一维或二维数组,np.savetxt()和np.loadtxt()只能有效存取一维或二维数组。

nmupy中随机数函数random

numpy中的统计函数

axis=1指的是对第二维度做运算,即对应行,axis=0即对第一维度做运算,即对应列

numpy中的梯度函数

 

pandas是基于numpy实现的扩展库

pandas提供了两个数据类型:Series(一维),DataFrame(二维及多维)

numpy是基础数据类型,关注数据的结构表达,维度是数据间关系

pandas是扩展数据类型,关注数据的应用表达,维度是数据与索引间关系

series类型由一组数据及与之相关的数据索引构成。有自动索引和自定义索引两种。

自动索引和自定义索引如下图所示:

         

series类型可以由如下类型创建:python列表,标量值,python字典,ndarray,其他函数。

  • python列表,index与列表元素个数一致。
  • 标量值,index表达series类型的尺寸。
  • python字典,键值对中的键是索引,index从字典中进行选择操作。
  • ndarray,索引和数据都可以通过ndarray类型创建。
  • 其他函数,range()函数等。

自动索引和自定义索引并存,但不能混用。

series是一维带“标签”的数组。

series基本操作类似ndarray和字典,根据索引对齐。

DataFrame类型

dataframe类型由共用相同索引的一组列组成。

dataframe是一个表格型的数据类型,每列值类型可以不同。

dataframe既有行索引,也有列索引。

dataframe常用于表达二维数据,但可以表达多维数据。

dataframe类型可由以下类型创建;

  • 二维ndarray对象
  • 由一维ndarray,列表,字典,元组或series构成的字典
  • series类型
  • 其他的dataframe类型

dataframe是二维带“标签”数组。

dataframe基本操作类似series,依据行列索引。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值