numpy数组按某一维度相加_Numpy/Pandas数据分析基础知识及案例应用

最新推荐文章于 2023-03-08 21:11:48 发布

weixin_39525118

最新推荐文章于 2023-03-08 21:11:48 发布

阅读量3.7k

点赞数

文章标签： numpy数组按某一维度相加 pandas 取excel 中的某一列 pandas打印某一列

本文介绍了Numpy和Pandas在数据分析中的基本操作，包括一维数据分析（Numpy的array和Pandas的Series），二维数据分析（Numpy的二维数组和Pandas的DataFrame）。通过案例展示了如何进行数据查询、统计分析和数据清洗，包括数组的相加、Series的索引定位、数据框的描述统计和缺失值处理等。

摘要由CSDN通过智能技术生成

在数据分析领域中，用到最多的包是numpy（用于数学计算）、pandas（基于numpy的数据分析工具，方便对表的数据结构进行分析）和matplotlib（图形绘制库，用于数据分析结果的可视化）。本文首先了解下Numpy和pandas在数据分析中的一些基本操作。

本文结构如下：

一、一维数据分析

二、二维数据分析

三、案例：销售数据分析

一、一维数据分析

Numpy中表示一维数组的是array，pandas表示一维数组的是Series。Series是建立在numpy基础上的，比array有更多的功能。使用这两个数组首先用import导入numpy和pandas这两个包。

（一）Numpy 一维数组array

定义一个数组：

查询访问array中的元素：

通过for i in 数组名遍历数组中的元素：

通过数组名.dtype查看数组中元素的数据类型：

Numpy数组array和列表的区别：

1、array可以进行统计功能，如求平均值mean()，标准差std()

2、array可以进行向量化运算（相加、乘法）

查看下图中array和列表相加结果的区别。

3、array中元素必须是同一种数据类型，列表中的元素可以是不同数据类型。

如图，虽然数组array1中的元素1和3看起来是数据类型，但是在打印出来之后，1和3都作为字符串类型了。而列表list1中的1和3打印出来是数据类型。

上图array2中的元素包含列表和字符串，两种数据类型不相同，在打印的时候就会报错，如果将1和3也改成列表，就可以打印了：

可以看到array2里的元素是3个列表。

（二）pandas 一维数组Series

Series和array的主要区别是Series可以通过索引定位数组中的数据。在定义的时候通过index定义索引。

要注意这里的Series首字母应大写，不然会报错。而定义array的时候首字母不用大写。Series后面接小括号，小括号前半部分是列表形式的元素，后半部分是用index=[]指定每个元素的索引，方便以后通过索引访问其中的元素。

可以通过describe获取数组的描述统计信息（元素个数，平均值，标准差，四分位数，最大最小值），数组名.describe()：

获取数组中的元素：

方法一：用iloc属性根据位置获取元素

方法二：用loc属性根据索引获取对应的元素

Series向量运算：

1、用加号+直接相加，索引值相同的元素才会相加，只出现在一个数组里的索引相加之后的值为空值。

在数据分析中，可以通过Ser.dropna()删除掉空值。

最低0.47元/天解锁文章

weixin_39525118

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。