其他用法:https://blog.csdn.net/sinat_35562946/article/details/81058221
pandas中利用 .iloc 和 .loc 选取数据
2018-06-13 17:24:18 Carolinedy 阅读数 19921更多
分类专栏: Python
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Carolinedy/article/details/80681861
Pandas 基本的数据结构是 Series(数组) 和 DataFrame(类似二维数组),Pandas 提供了 Index 对象,每个 Series 都会带有一个对应的Index,用来标记不同的元素,Index 的内容不一定是数字,也可以是字母、中文等,它类似于SQL中的主键
Pandas 读取文件时候,注意文件的存储路径不能带有中文,否则读取可能出错。
.iloc:根据标签的所在位置,从0开始计数,选取列
loc:根据DataFrame的具体标签选取列
具体选择结果请看示例:
-
import pandas as pd
-
filename='../file/testiloc'
-
data=pd.read_excel(filename)
-
data_test1=data.iloc[:,:8] #选取位置为[0,8)列的整列数据
-
data_test2=data.iloc[0:2,8] #选取位置为8的列的[0,2)行的数据
-
data_test3=data.loc[0:2,'工龄'] #选取列名为‘工龄’的[0,2]行的数据
-
>>>print(data_test1)
-
年龄 工龄 教育 工资 消费 饮食 购物 旅行
-
0 ...
-
1
-
2 ...
-
...
-
n ...
-
>>>print(data_test2)
-
交通
-
0 100
-
1 200
-
>>>print(data_test3)
-
工龄
-
0 10
-
1 11
-
2 15
data.iloc[0:2,8] # ',' 前的部分标明选取的行,‘,’后的部分标明选取的列