numpy数组按某一维度相加_Numpy/Pandas数据分析基础知识及案例应用

本文介绍了Numpy和Pandas在数据分析中的基本操作,包括一维数据分析(Numpy的array和Pandas的Series),二维数据分析(Numpy的二维数组和Pandas的DataFrame)。通过案例展示了如何进行数据查询、统计分析和数据清洗,包括数组的相加、Series的索引定位、数据框的描述统计和缺失值处理等。
摘要由CSDN通过智能技术生成

在数据分析领域中,用到最多的包是numpy(用于数学计算)、pandas(基于numpy的数据分析工具,方便对的数据结构进行分析)和matplotlib(图形绘制库,用于数据分析结果的可视化)。本文首先了解下Numpy和pandas在数据分析中的一些基本操作。

本文结构如下:

一、一维数据分析

二、二维数据分析

三、案例:销售数据分析

一、一维数据分析

Numpy中表示一维数组的是array,pandas表示一维数组的是Series。Series是建立在numpy基础上的,比array有更多的功能。使用这两个数组首先用import导入numpy和pandas这两个包。

v2-79f64abb968bcf4f90498f60e09435ef_b.jpg

(一)Numpy 一维数组array

  • 定义一个数组:

v2-7baf11c093b44f3373a54816aa44045e_b.jpg
  • 查询访问array中的元素:

v2-b522ff6867073de77308603f47cd96c7_b.jpg
  • 通过for i in 数组名遍历数组中的元素:

v2-fd621f19fbe51a2e9cf5f5aafc796a6d_b.jpg
  • 通过数组名.dtype查看数组中元素的数据类型:

v2-64a7bf5f7fbb22098b770a2b038d2c09_b.jpg

Numpy数组array和列表的区别:

1、array可以进行统计功能,如求平均值mean(),标准差std()

v2-901f754e19c8104bf746a60d342052e0_b.jpg

2、array可以进行向量化运算(相加、乘法)

查看下图中array和列表相加结果的区别。

v2-b9faff4f8d8c9586796b152b5c5bd249_b.jpg

3、array中元素必须是同一种数据类型,列表中的元素可以是不同数据类型。

v2-799ae81fdb280e9d5646c5b108985053_b.jpg

如图,虽然数组array1中的元素1和3看起来是数据类型,但是在打印出来之后,1和3都作为字符串类型了。而列表list1中的1和3打印出来是数据类型。

v2-7f90efd8effb78d6ad4ecd14ac2c02f2_b.jpg

上图array2中的元素包含列表和字符串,两种数据类型不相同,在打印的时候就会报错,如果将1和3也改成列表,就可以打印了:

v2-c4e816161a9570f3ad8cd0cbbdb4c2b5_b.jpg

可以看到array2里的元素是3个列表。

(二)pandas 一维数组Series

  • Series和array的主要区别是Series可以通过索引定位数组中的数据。在定义的时候通过index定义索引。

v2-4bd20270b92644aed7330c3a2597d682_b.jpg

要注意这里的Series首字母应大写,不然会报错。而定义array的时候首字母不用大写。Series后面接小括号,小括号前半部分是列表形式的元素,后半部分是用index=[]指定每个元素的索引,方便以后通过索引访问其中的元素。

v2-bcbdc6b1fe0d11abb3bf04b2f1c13b0e_b.jpg
  • 可以通过describe获取数组的描述统计信息(元素个数,平均值,标准差,四分位数,最大最小值),数组名.describe()

v2-90c3eb0b967bfc7d2a729d1bc5755e41_b.jpg
  • 获取数组中的元素:

方法一:用iloc属性根据位置获取元素

v2-57943fbbaa4889e1f43174125f4688c3_b.jpg

方法二:用loc属性根据索引获取对应的元素

v2-d8a2c0e201371e670af54435e8921432_b.jpg
  • Series向量运算:

1、用加号+直接相加,索引值相同的元素才会相加,只出现在一个数组里的索引相加之后的值为空值。

v2-46b43d61e16d4f8c0535f9463a61aa7f_b.jpg

在数据分析中,可以通过Ser.dropna()删除掉空值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值