numpy和pandas

最新推荐文章于 2024-06-21 11:09:59 发布

码小花

最新推荐文章于 2024-06-21 11:09:59 发布

阅读量694

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sarracode/article/details/104210444

版权

机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

目录

ndarray数据的创建方法

数组的索引和切片

数组与标量之间的运算（作用于数组中的每一个元素）

numpy一元函数，对ndarray中的数据执行元素级运算的函数

nunpy中二元函数

csv文件，用逗号分隔值

nmupy中随机数函数random

numpy中的统计函数

numpy中的梯度函数

pandas是基于numpy实现的扩展库

ndarray数据的创建方法

1.从python中的列表、元组等类型创建ndarray数组

x = np.array(list/tuple)

x = np.array(list/tuple,dtype=np.float32)

当np.array()不指定dtype时，numpy将根据数据情况关联一个dtype类型。

2.使用numpy中函数创建naarray数组，如；array、ones、zeros等

其中ndarray数组的维度变换方法如下图

因此在使用的时候要注意哪些方法是改变原数组，哪些是不改变原数组的，举例如下图：

ndarray数组类型的变化方法astype（），该方法一定会创建新的数组（原始数据的一个拷贝），即使两个类型一致。

naarray数组向列表的转换方法tolist（），如下图：

3.从字节流（raw bytes）中创建ndarray数组

4.从文件中读取特定格式，创建ndarray数组。

数组的索引和切片

索引：获取数组中特定位置元素的过程

切片：获取数组元素子集的过程，例如 a[起始编号：终止编号（不含）：步长]

多维数组的索引，举例如下：

多维数组的切片，举例如下：

数组与标量之间的运算（作用于数组中的每一个元素）

numpy一元函数，对ndarray中的数据执行元素级运算的函数

nunpy中二元函数

csv文件，用逗号分隔值

使用savetxt函数向csv中写入数据，具体方法如下并举例：

使用loadtxt函数从csv文件中读取数据，具体方法如下并举例：

需要注意的是csv文件只能有效的存储一维或二维数组，np.savetxt()和np.loadtxt()只能有效存取一维或二维数组。

nmupy中随机数函数random

numpy中的统计函数

axis=1指的是对第二维度做运算，即对应行，axis=0即对第一维度做运算，即对应列

numpy中的梯度函数

pandas是基于numpy实现的扩展库

pandas提供了两个数据类型：Series（一维），DataFrame（二维及多维）

numpy是基础数据类型，关注数据的结构表达，维度是数据间关系

pandas是扩展数据类型，关注数据的应用表达，维度是数据与索引间关系

series类型由一组数据及与之相关的数据索引构成。有自动索引和自定义索引两种。

自动索引和自定义索引如下图所示：

series类型可以由如下类型创建：python列表，标量值，python字典，ndarray，其他函数。

python列表，index与列表元素个数一致。
标量值，index表达series类型的尺寸。
python字典，键值对中的键是索引，index从字典中进行选择操作。
ndarray，索引和数据都可以通过ndarray类型创建。
其他函数，range（）函数等。

自动索引和自定义索引并存，但不能混用。

series是一维带“标签”的数组。

series基本操作类似ndarray和字典，根据索引对齐。

DataFrame类型

dataframe类型由共用相同索引的一组列组成。

dataframe是一个表格型的数据类型，每列值类型可以不同。

dataframe既有行索引，也有列索引。

dataframe常用于表达二维数据，但可以表达多维数据。

dataframe类型可由以下类型创建；

二维ndarray对象
由一维ndarray，列表，字典，元组或series构成的字典
series类型
其他的dataframe类型

dataframe是二维带“标签”数组。

dataframe基本操作类似series，依据行列索引。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

码小花 CSDN认证博客专家 CSDN认证企业博客

码龄5年

55: 原创

8万+: 周排名

122万+: 总排名

8万+: 访问

: 等级

1081: 积分

20: 粉丝

75: 获赞

17: 评论

395: 收藏

私信

关注

热门文章

分类专栏

最新评论

bert中文使用总结
m0_75217567: 博主能分享一下预训练模型吗？科大讯飞能够已经下载不了了
决策树例子与python实现
m0_64860572: 有c4.5决策树代码的例子吗
文本蕴涵模型测试过程
uuunicornM: “在运行train.py文件时遇到错误：InvalidArgumentError (see above for traceback): indices[0，10] = 47392 is not in [0, 45100) 是因为换了数据，因此词典和npy文件都要重新生成” 你好，我也出现了这个问题，请问是怎么解决的？
bert中文使用总结
Ang_Quantum: 感谢博主的文章！顺便想问一个问题，我把Google的BERT转为torch版本后，发现模型生成的向量和tensorflow版本的有略微的不一样(2%的相似度误差)。楼主知道是什么原因吗？有没有让torch生成的向量和tensorflow完全一样的方法呢？
octave的基本操作
LHNC: 为什么函数就是未定义，我用遍了网上找到的方法T-T

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。