python dataframe根据列号取出列

原文:https://thispointer.com/select-rows-columns-by-name-or-index-in-dataframe-using-loc-iloc-python-pandas/

比如这个数据:

students = pd.DataFrame([ ('jack', 34, 'Sydeny') ,
             ('Riti', 30, 'Delhi' ) ,
             ('Aadi', 16, 'New York') ], columns = ['Name' , 'Age', 'City'], index=['a', 'b', 'c'])
   Name  Age      City
a  jack   34    Sydeny
b  Riti   30     Delhi
c  Aadi   16  New York

注意列号是从0开始的。取出列号为1的列:

students.iloc[:,1]
a    34
b    30
c    16
Name: Age, dtype: int64

取出列号为0和2的列:

students.iloc[:,[0,2]]
   Name      City
a  jack    Sydeny
b  Riti     Delhi
c  Aadi  New York
### 回答1: 要从Python DataFrame取出,可以使用以下语法: ```python df['column_name'] ``` 其中,`df`是DataFrame对象,`column_name`是要取出的名称。例如,如果DataFrame对象名为`data`,要取出名为`age`的,可以使用以下代码: ```python data['age'] ``` 这将返回一个Series对象,其中包含`age`的所有值。 ### 回答2: Python的pandas库提供了DataFrame数据结构,能够对数据进行操作、处理、分析和可视化等。数据框或者说DataFrame就是一种类似于数据库表格形式的数据结构,其中的数据以二维数组的形式存储,其中每一行代表一个样本数据,每一代表不同的特征。 当需要从DataFrame中提取某数据时,可以使用以下方法: 1. loc方法:通过名来提取 ```Python import pandas as pd # 创建一个DataFrame df = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] }) # 使用loc方法,传递参数'名',取出数据 col_a = df.loc[:, 'A'] print(col_a) # 输出:0 1 # 1 2 # 2 3 # Name: A, dtype: int64 ``` 2. iloc方法:通过索引来提取 ```Python import pandas as pd # 创建一个DataFrame df = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] }) # 使用已知的整数索引,取出数据 col_b = df.iloc[:, 1] print(col_b) # 输出:0 a # 1 b # 2 c # Name: B, dtype: object ``` 3. 通过DataFrame的.操作符,并传入取出数据 ```Python import pandas as pd # 创建一个DataFrame df = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] }) # 使用.操作符,传递名,取出数据 col_a = df['A'] print(col_a) # 输出:0 1 # 1 2 # 2 3 # Name: A, dtype: int64 ``` 以上三种方法都能够取出DataFrame中的,这需要根据实际需要来使用不同的方法。如果你使用了多个方法,想要将提取到的转换为表,只需添加一个tolist()的方法即可。 ```Python import pandas as pd # 创建一个DataFrame df = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] }) # 使用.操作符,传递名,取出数据,并转换为表 col_a = df['A'].tolist() print(col_a) # 输出:[1, 2, 3] ``` 值得注意的是,当DataFrame名非常长或者包含特殊字符时,使用.操作符的方式就会出错。因此,建议在调用DataFrame方法的时候使用[]语法。另外,在使用以上方法的时候,一定要注意DataFrame的大小写问题,否则会导致结果为None的情况。 ### 回答3: Python中的DataFrame是pandas库中的数据结构,它是一种二维表格数据结构,可以用来存储结构化数据。在DataFrame中,每一可以看作是一个Series类型的数据结构,每一行则对应着一个记录。 在Python中,我们可以使用DataFrame来处理各种数据集,如果我们需要取出其中的某一,可以通过以下的方式来完成: 1. 通过名称进行取出 我们可以通过名称来取出某一的数据,比如我们有以下的一个DataFrame: ``` import pandas as pd df = pd.DataFrame({ 'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40], 'gender': ['F', 'M', 'M', 'M'] }) print(df) ``` 上述代码会输出以下的结果: ``` name age gender 0 Alice 25 F 1 Bob 30 M 2 Charlie 35 M 3 David 40 M ``` 要想取出其中的一数据,比如“age”,我们只需要使用以下的代码: ``` age_col = df['age'] print(age_col) ``` 上述代码会输出以下的结果: ``` 0 25 1 30 2 35 3 40 Name: age, dtype: int64 ``` 我们可以看到,通过名称来取出数据,得到的结果是一个Series类型的数据结构。 2. 通过的序号进行取出 除了通过名称来取出数据,我们也可以通过的序号来取出某一的数据,比如我们要取出“gender”的数据,我们可以使用以下的代码: ``` gender_col = df.iloc[:, 2] print(gender_col) ``` 上述代码会输出以下的结果: ``` 0 F 1 M 2 M 3 M Name: gender, dtype: object ``` 我们可以看到,通过的序号来取出数据,得到的结果同样是一个Series类型的数据结构。 总结 在Python中,我们可以通过DataFrame来处理各种数据集,如果我们需要取出其中的某一,可以通过名称或的序号来完成。无论使用哪种方式,得到的结果都是一个Series类型的数据结构。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值