Python数据分析之Pandas-1

最新推荐文章于 2024-05-30 11:43:13 发布

wwkkjjtt

最新推荐文章于 2024-05-30 11:43:13 发布

阅读量78

点赞数 2

文章标签： python 数据分析 pandas

本文链接：https://blog.csdn.net/m0_73665080/article/details/132645478

版权

基本介绍

pandas是基于numpy的一种工具，该工具是为了解决数据分析任务而创建的。pandas纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数与方法。
导入库：

代码如下：

import pandas as pd
import numpy as np

pandas中有两种常用的基本结构：

Series
- 一维数组，与numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series能保存不同种数据类型，字符串、boolean值、数字等都能保存在Series中。
DateFrame
- 二维的表格数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。以下内容主要以DataFrame为主。

pandas库的DataFrame是个二维结构，这里首先构造一组时间序列，作为我们第一位的下标。从2018年1月1日起，创建6个时间。
用传入二维数组（np生成正态分布的6行4列的随机数）的方式，创建一个DataFrame结构。默认情况下不指定index和columns，那它们的值将用从0开始的数字代替。
这里我们用刚刚创建的时间序列，指定index的值；用“ABCD”指定columns的值，将得到以下DataFrame结构：
除了向DataFrame传入二维数组的方式，还可以使用字典传入数据。如下示例：

在这里插入图片描述

在这里插入图片描述

行操作：
- 使用iloc()函数或者loc()函数，获取某几行的数据。
- 添加一行：使用字典传入新添加这一行的数据，再转成一维数组。再使用append()函数将这一行添加到原二维数组。
- 删除一行：使用drop()函数，将刚添加的那一行删去。
列操作：
- 使用df.columns显示df数组的所有列字段。用df[‘列名称’]查看莫一列的数据。
- 增加一列：新增一列，可以用df[‘新一列的名称’]的方式。
- 删除一列：使用drop（）函数，将列名称作为参数。axis参数用于指定删除的方向，默认值为0，表示删除行；指定为1时，表示删除列。
- 通过标签选择数据:指定行，指定列即可。
条件选择：
- 使用字段的判断来选取，df['产地']=="美国"的返回值为bool类型。