(100天2小时第十八天)Pandas入门

本文介绍了Pandas的Series和DataFrame的基本操作,包括导入库、创建Series的loc和iloc索引、DataFrame的数据类型及操作,如读取数据、增加和删除列、转置和取值等。重点讲解了loc和iloc的区别,以及DataFrame的构造和数据处理方法。
摘要由CSDN通过智能技术生成

一、导入库

from pandas import Series,DataFrame
import pandas as pd

二、创建Series取索引

Series对象有loc和iloc成员变量,如下图所示:
loc的数据类型为pandas.core.indexing,_LocIndexer
iloc的数据类型为pandas.core.indexing,_iLocIndexer
用loc进行索引时,中括号[ ]中的值必须是索引的真实值;
用iloc进行索引时,中括号[ ]中的值必须是整数,与列表list索引取值类似,例如obj.iloc[2]就是取第3行的值。

obj=Series([4,7,-5,3],index=['d','b','a','c'])
print(obj)
print(obj.loc)
print(obj.loc['b'])#索引
print(obj.iloc[2])#整数
d    4
b    7
a   -5
c    3
dtype: int64
<pandas.core.indexing._LocIndexer object at 0x0000022039593180>
7
-5

三、Pandas基本数据类型-DataFrame

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型 。
Dataframe既有行索引也有列索引,它可以被看做由 Series组成的字典(共用同一个索引)。
跟其他类似的数据结构相比(如R的dataframe), Data frame中面向行和面向列的操作基本上是平衡的。
其实, Dataframe中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。

1.用于构造DataFrame的数据

data = {'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Neveda'],
       'year':[2000, 2000, 2002, 2001, 2002],
       'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}
df = DataFrame(data)
print(df)
    state  year  pop
0    Ohio  2000  1.5
1    Ohio  2000  1.7
2    Ohio  2002  3.6
3  Nevada  2001  2.4
4  Neveda  2002  2.9

自定义列的顺序:

data = {'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Neveda'],
       'year':[2000, 2000, 2002, 2001, 2002],
       'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}
#df = DataFrame(data)
df = DataFrame(data,columns&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值