1 打印出列和列名称 data.columns 和 data.columns.values
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Aritra'], 'Age': [25, 30, 35], 'Location': ['Seattle', 'New York', 'Kona']}, index=([10, 20, 30]))
2.通过方括号可以进行单列的查询,Age是列名称,
print(type(df["Age"])) 打印出:<class 'pandas.core.series.Series'>
如果要打印DataFrame
print(type(df[["Age"]])),需要方括号里面再次添加一个方括号
如何打印出多列呢,print(df[["Age","Location"]])
这个方法的优点在于,可以按任意顺序返回列。如果你想改变顺序,你可以在列表中更改它:
如何在Pandas中按数据类型选择列
例如,此方法允许您选择所有数字列。这可以通过使用名为.select_dtypes()的方法来完成。
2.除了使用 df[["列名称"]],还有一种方式,使用 loc 选择 Columns
df.Ioc["行",“列”],来获取列和行
因此,您可以简单地传入一个冒号(:),它可以选择所有行。
print(df.loc[:, 'Age']),选择Age列所有行
现在,如果您只想选择名称列和前三行,您可以编写:
selection = df.loc[:2,'age'],如果是通过0进行编号的时候这样写
selection = df.loc[:20,'age'],这里行号是从,10开始,20,30,所以行号应该是20,代表前两行
使用iloc选择列
iloc函数是Pandas中选择数据的主要方式之一。方法“iloc”代表整数位置索引,其中使用行和列的整数位置来选择行和列。
此方法适用于:
按列位置(索引)选择列,
使用单个位置、位置列表或位置切片选择列
df.iloc[ : , :2],:代表所有行,:2代表前三列
df.iloc[ :2 ,]代表前两行,所有列,df.iloc[ :2]后边的逗号可以省掉
iloc,注意使用了这个函数,和行标签10,20没有关系,这个是行编号,不是索引
如何在Pandas中选择包含字符串的列名
df.loc[ : , [col for col in df.columns if 'Name' in col]] 包含Name的列打印出所有行
如何选择符号条件的列呢,满足指定条件的列一次性查询出来
总结,如果使用:df["Name"]只能选择单列,如果要查询多列,就需要使用iloc和loc方法
iloc和loc不同是
iloc 一般情况是:纯整数基于位置的索引,用于按位置进行选择。
.loc[]主要基于标签,进行数据选择