Pandas
文章平均质量分 92
煉心_
永遠的初級程序員...
展开
-
Pandas实战-筛选DataFrame
本文将主要介绍以下内容:1. 针对内存使用优化数据集2. 按单一条件筛选3. 按多个条件筛选4. 其它筛选方法5. 处理重复项在前面的文章中,我们练习了从DataFrame中选择单独的行,列和值。现在让我们探索如何基于一个或多个条件来筛选数据。1. 针对内存使用优化数据集和往常一样,让我们从导入pandas开始:In[1]: import pandas as pd接下来让我们看看要使用的employee.csv测试数据集,它是公司虚构的员工集合。每条记录都...原创 2021-03-07 23:27:59 · 2285 阅读 · 1 评论 -
Pandas实战-DataFrame对象
本文将主要介绍以下内容:1. DataFrame概述2. Series和DataFrame的相似点3. DataFrame排序4. 按DataFrame索引排序5. 设置新索引6. 从DataFrame读取列7. 从DataFrame读取行8. 重命名列或行9. 重置索引DataFrame是Pandas的另外一个主要的数据结构,它是由行和列组成的二维数据结构,因此需要两个参考点来从数据集中提取给定值。1. DataFrame概述DataFra...原创 2021-02-24 23:35:04 · 1824 阅读 · 0 评论 -
Pandas实战-Series的方法
本文将主要介绍以下内容:1. 导入CSV数据集2. 排序Series值3. 修改原Series值4. 统计Series值5. apply方法在介绍Series的方法之前,需要一些现实世界的数据集,本文会使用以下三个CSV文件:- pokemon.csv,超过800个的Pokémon,这是任天堂最受欢迎的宠物小精灵- google_stock.csv,Google从2004年8月首次亮相到2019年10月的每日美元价格- revolutionary_war.csv,美.原创 2021-02-15 05:04:28 · 1351 阅读 · 0 评论 -
Pandas实战-Series对象
本文将主要介绍以下内容:1. Series概述2. 从Python对象创建Series3. 读取最前面和最后面的数据4. 数学运算5. 将Series传递给Python的内置函数Series是Pandas的两个主要数据结构之一,它是用于存储同质数据的一维标记数组。术语“同质”是指这些值具有相同的数据类型。每个Series的值都被分配一个标签和顺序。标签是值的标识符,可以是任何数据类型;顺序用整数表示,第一个值位于位置0。数据结构是一维的,因为任何元素都可以通过其标签或..原创 2021-02-09 04:47:47 · 3785 阅读 · 0 评论