Pandas-数据结构-DataFrame（三）：列索引【df[‘列名‘]、df[[‘列名1‘,‘列名2‘]]、df.iloc[:, 2:6]】

u013250861

已于 2022-04-09 19:24:05 修改

阅读量2.5k

点赞数 1

分类专栏： Pandas 文章标签： Pandas DataFrame 列索引

于 2022-04-09 18:47:55 首次发布

本文链接：https://blog.csdn.net/u013250861/article/details/124065681

版权

Pandas 专栏收录该内容

45 篇文章 20 订阅

订阅专栏

该博客介绍了如何使用Pandas库中的DataFrame结构通过列名选择数据。通过`df['col_name']`可以提取单列数据为Series，而`df[['col_name1', 'col_name2']]`则用于选取多列生成新的DataFrame。示例代码展示了如何创建一个DataFrame并按列名选择数据，输出结果展示了选择单列和多列后的不同数据类型。

摘要由CSDN通过智能技术生成

1、df[‘col_name’]：按照“列名”索引提取列数据

按照列名选择列，只选择一列输出Series，选择多列输出Dataframe

df[]一般用于选择列，[]中写列名（所以一般数据colunms都会单独制定，不会用默认数字列名，以免和index冲突）；
单选列为Series，print结果为Series格式；
多选列为Dataframe，print结果为Dataframe格式；

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(12).reshape(3, 4) * 100,
                  index=['one', 'two', 'three'],
                  columns=['a', 'b', 'c', 'd'])
print("df = ", df)
print('-' * 100)

# 按照列名选择列，只选择一列输出Series，选择多列输出Dataframe
data1 = df['a']
data2 = df[['a', 'c']]
print("data1 = \n{0}\ntype(data1) = {1}".format(data1, type(data1)))
print('-' * 100)
print("data2 = \n{0}\ntype(data2) = {1}".format(data2, type(data2)))

打印结果：

df =                 a          b          c          d
one    12.427304  39.089892  22.467365  22.711018
two    50.808058  67.916443  39.312617  95.227642
three   3.399731  57.874266  45.771234  99.649908
----------------------------------------------------------------------------------------------------
data1 = 
one      12.427304
two      50.808058
three     3.399731
Name: a, dtype: float64
type(data1) = <class 'pandas.core.series.Series'>
----------------------------------------------------------------------------------------------------
data2 = 
               a          c
one    12.427304  22.467365
two    50.808058  39.312617
three   3.399731  45.771234
type(data2) = <class 'pandas.core.frame.DataFrame'>

u013250861

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Pandas-数据结构-DataFrame（三）：列索引【df[‘列名‘]、df[[‘列名1‘,‘列名2‘]]、df.iloc[:, 2:6]】

1、df[‘col_name’]：按照“列名”索引提取列数据按照列名选择列，只选择一列输出Series，选择多列输出Dataframedf[]一般用于选择列，[]中写列名（所以一般数据colunms都会单独制定，不会用默认数字列名，以免和index冲突）；单选列为Series，print结果为Series格式；多选列为Dataframe，print结果为Dataframe格式；import numpy as npimport pandas as pddf = pd.DataFrame(n
复制链接

扫一扫

专栏目录