一文带你了解数据分析的iloc和loc功能

最新推荐文章于 2024-06-17 14:27:56 发布

Python学研大本营

最新推荐文章于 2024-06-17 14:27:56 发布

阅读量913

点赞数 8

文章标签：数据分析数据挖掘

本文链接：https://blog.csdn.net/weixin_39915649/article/details/134398293

版权

本文将带你了解用于数据分析的iloc和loc函数。

微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩

简介

在处理大型数据集时，使用有效的数据操作和提取技术是必要的。Pandas数据分析库提供了强大的工具，用于处理结构化数据，包括使用iloc和loc函数访问和修改DataFrame元素的能力。在本文中，我们将探讨iloc和loc之间的区别、它们的用途以及如何成功地使用它们的实际示例。

在深入研究iloc和loc之前，让我们先了解一下Pandas中的DataFrame索引是如何工作的。DataFrame是一个带有标记行（索引）和列的二维表格数据结构。索引可以是数字的、基于字符串的，甚至可以是数字和字符串的组合。Pandas允许使用各种索引技术访问和操作DataFrame元素。

`iloc`

iloc函数基于整数，允许使用基于整数的位置访问DataFrame元素。

它遵循基于0的索引系统，其中第一个元素的索引为0，第二个为1，以此类推。使用Python中的iloc函数，我们可以使用索引值轻松地从行或列中检索任何特定值。

iloc的一般语法如下所示：

pandas.DataFrame.iloc[row_index, column_index]

其中，row_index和column_index可以是整数、切片或布尔数组。

在上面的代码示例中，我们首先将pandas导入为pd，然后通过在DataFrame中传递country_data作为参数，将country_data对象转换为DataFrame。这将把country_data转换为二维数据结构。

在创建DataFrame后，我们可以通过调用iloc函数使用它们的索引来访问df数据帧中的数据。在这种情况下，df.iloc[0,1]返回存储在零行第一列中的数据。

要访问存储在第三行的continent数据，我们使用df.iloc[3, 1]，它返回“Africa”。

iloc函数还接受单个参数，该参数返回该索引中的所有数据。例如，df.iloc[1]将返回“Spain, Europe”。

`loc`

与iloc不同，loc函数允许我们使用索引或列名的标签访问DataFrame元素。与iloc相比，它提供了一种更直观和灵活的索引方式。

loc的一般语法如下所示：

df.loc[row_label, column_label]

其中，row_label和column_label可以是标签、切片或布尔数组。

使用上面的country_data代码。要访问USA的洲，请使用：

item = df.loc[df[‘country’] == ‘USA’, ‘continent’]

这将返回“North America”。

在上面的示例中，我们使用条件df[‘Age’] >= 30作为行索引器。它返回一个布尔数组，其中True表示满足条件的行。将此布尔数组传递给df.loc[]仅选择并显示条件为True的行。在这种情况下，将返回第2行和第3行的项目。

`iloc`和`loc`之间的区别

虽然两者都用于从DataFrame中选择数据，但它们在索引方法上有所不同。

iloc使用基于整数的索引，允许我们使用整数位置选择数据，而loc使用基于标签的索引，允许我们使用行和列标签选择数据。
当使用标签切片数据时，loc包括起始和结束点，而iloc仅包括起始点。
loc支持非整数标签用于行和列，而iloc仅支持基于整数的行和列标签。

何时使用iloc

当涉及到基于数值的索引或需要基于位置的提取时，iloc函数是理想的选择。
iloc可用于根据其整数位置检索特定元素。
当你想要使用基于数字的切片提取一系列行或列时，iloc是最佳选择。

何时使用loc

当根据标签或布尔数组检索特定元素时。
使用基于标签的切片提取一系列行或列时。
当处理具有非整数标签的DataFrame时。

结论

Pandas的loc和iloc函数提供了数据操作和索引的强大工具。有效的数据分析和操作需要了解这些函数之间的差异及其各自的用例。熟练掌握loc和iloc将帮助数据科学家和分析师充分利用pandas的潜力，并提高从大型数据集中获取见解的能力。

推荐书单

IT BOOK 多得（点击查看5折活动书单）https://u.jd.com/psx2y1M

《Pandas1.x实例精解》

《Pandas1.x实例精解》详细阐述了与Pandas相关的基本解决方案，主要包括Pandas基础，DataFrame基本操作，创建和保留DataFrame，开始数据分析，探索性数据分析，选择数据子集，过滤行，对齐索引，分组以进行聚合、过滤和转换，将数据重组为规整形式，组合Pandas对象，时间序列分析，使用Matplotlib、Pandas和Seaborn进行可视化，调试和测试等内容。此外，该书还提供了相应的示例、代码，以帮助读者进一步理解相关方案的实现过程。《Pandas1.x实例精解》适合作为高等院校计算机及相关专业的教材和教学参考书，也可作为相关开发人员的自学用书和参考手册。

《Pandas1.x实例精解》https://item.jd.com/13255935.html

精彩回顾

《Pandas对比Polars，语法和速度大PK》

《50行代码探索金融数据，使用Python进行时间序列分析和预测》

《轻松入门Python量化交易（上）》

《轻松入门Python量化交易（中）》

《轻松入门Python量化交易（下）》

《使用GeoPandas进行地理空间数据可视化》