(100天2小时第十八天）Pandas入门

最新推荐文章于 2023-05-14 17:39:40 发布

Killwaiter

最新推荐文章于 2023-05-14 17:39:40 发布

阅读量786

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/zhangxue1232/article/details/109655497

版权

本文介绍了Pandas的Series和DataFrame的基本操作，包括导入库、创建Series的loc和iloc索引、DataFrame的数据类型及操作，如读取数据、增加和删除列、转置和取值等。重点讲解了loc和iloc的区别，以及DataFrame的构造和数据处理方法。

摘要由CSDN通过智能技术生成

一、导入库

from pandas import Series,DataFrame
import pandas as pd

二、创建Series取索引

Series对象有loc和iloc成员变量，如下图所示：
loc的数据类型为pandas.core.indexing,_LocIndexer，
iloc的数据类型为pandas.core.indexing,_iLocIndexer，
用loc进行索引时，中括号[ ]中的值必须是索引的真实值；
用iloc进行索引时，中括号[ ]中的值必须是整数，与列表list索引取值类似，例如obj.iloc[2]就是取第3行的值。

obj=Series([4,7,-5,3],index=['d','b','a','c'])
print(obj)
print(obj.loc)
print(obj.loc['b'])#索引
print(obj.iloc[2])#整数

d    4
b    7
a   -5
c    3
dtype: int64
<pandas.core.indexing._LocIndexer object at 0x0000022039593180>
7
-5

三、Pandas基本数据类型-DataFrame

DataFrame 是一个表格型的数据结构,它含有一组有序的列，每列可以是不同的值类型。
Dataframe既有行索引也有列索引,它可以被看做由 Series组成的字典(共用同一个索引)。
跟其他类似的数据结构相比(如R的dataframe), Data frame中面向行和面向列的操作基本上是平衡的。
其实, Dataframe中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。

1.用于构造DataFrame的数据

data = {'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Neveda'],
       'year':[2000, 2000, 2002, 2001, 2002],
       'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}
df = DataFrame(data)
print(df)

    state  year  pop
0    Ohio  2000  1.5
1    Ohio  2000  1.7
2    Ohio  2002  3.6
3  Nevada  2001  2.4
4  Neveda  2002  2.9

自定义列的顺序：

data = {'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Neveda'],
       'year':[2000, 2000, 2002, 2001, 2002],
       'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}
#df = DataFrame(data)
df = DataFrame(data,columns&#