一、导入库
from pandas import Series,DataFrame
import pandas as pd
二、创建Series取索引
Series对象有loc和iloc成员变量,如下图所示:
loc的数据类型为pandas.core.indexing,_LocIndexer
,
iloc的数据类型为pandas.core.indexing,_iLocIndexer
,
用loc进行索引时,中括号[ ]中的值必须是索引的真实值;
用iloc进行索引时,中括号[ ]中的值必须是整数,与列表list索引取值类似,例如obj.iloc[2]就是取第3行的值。
obj=Series([4,7,-5,3],index=['d','b','a','c'])
print(obj)
print(obj.loc)
print(obj.loc['b'])#索引
print(obj.iloc[2])#整数
d 4
b 7
a -5
c 3
dtype: int64
<pandas.core.indexing._LocIndexer object at 0x0000022039593180>
7
-5
三、Pandas基本数据类型-DataFrame
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型 。
Dataframe既有行索引也有列索引,它可以被看做由 Series组成的字典(共用同一个索引)。
跟其他类似的数据结构相比(如R的dataframe), Data frame中面向行和面向列的操作基本上是平衡的。
其实, Dataframe中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。
1.用于构造DataFrame的数据
data = {'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Neveda'],
'year':[2000, 2000, 2002, 2001, 2002],
'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}
df = DataFrame(data)
print(df)
state year pop
0 Ohio 2000 1.5
1 Ohio 2000 1.7
2 Ohio 2002 3.6
3 Nevada 2001 2.4
4 Neveda 2002 2.9
自定义列的顺序:
data = {'state':['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Neveda'],
'year':[2000, 2000, 2002, 2001, 2002],
'pop':[1.5, 1.7, 3.6, 2.4, 2.9]}
#df = DataFrame(data)
df = DataFrame(data,columns&#