df[条件][新增列名]与df.loc[条件][新增列名]区别(了解底层原因)

最新推荐文章于 2024-07-18 08:00:00 发布

PerpetualLearner

最新推荐文章于 2024-07-18 08:00:00 发布

阅读量5.1k

点赞数 2

分类专栏： Error Record # 小白学Python 文章标签： loc[][] df[][] Multiindex

本文链接：https://blog.csdn.net/the_time_runner/article/details/84554463

版权

小白学Python 同时被 2 个专栏收录

488 篇文章 81 订阅

订阅专栏

Error Record

144 篇文章 6 订阅

订阅专栏

在数据处理过程中,经常要对符合某种条件的行列进行操作,有时候会犯迷糊,这里详细解释一下pandas是怎么识别df[]的.

df[<条件>]   # 得到的是一个新的df1,对其进行任何操作,对原来的df不产生影响.
type(df[<条件>])   # 数据类型是DataFrame
>> <class 'pandas.core.frame.DataFrame'>


df['列名']   # 得到的是df中'列名'这一列,
type(df['列名'])   # 数据类型是series
>> <class 'pandas.core.series.Series'>

df['新列名'] = 0   # 原df发生改变,在df中添加新列,且新列取值为0

df[<条件>]['新增列名']=0   
# 这么写的本意是获取满足条件的新的df1,然后对新的df1增加新的一列,并将新的一列赋值为0,但此时会报错
# df[][] 这种结构,python会自动识别为获取Multiindex,具体见下图


=======================================================
=======================================================
df.loc[<条件>][<新增列名>]   
# 本质是一个函数.loc[row_index,col_index]有自己特定的语法规范
# df.loc[<条件>][<新增列名>]是想当然的,是不合语法的