DataFrame 拼接，筛选，修改

最新推荐文章于 2023-03-14 13:26:38 发布

AI算法网奇

最新推荐文章于 2023-03-14 13:26:38 发布

阅读量2.5k

点赞数

分类专栏： python宝典

本文链接：https://blog.csdn.net/jacke121/article/details/108831081

版权

python宝典专栏收录该内容

1012 篇文章 368 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了Python DataFrame的数据拼接方法，包括pd.merge()、pd.concat()和DataFrame.join()。pd.merge()类似于数据库的内连接，可设置连接条件；pd.concat()实现数据并集拼接，允许调整拼接方式和方向；DataFrame.join()则专注横向连接，适用于多列赋值。此外，还展示了如何筛选和修改DataFrame的特定行和列。

摘要由CSDN通过智能技术生成

lc.loc[lc["column_name"] == "valueb","column_b"]=6

筛选列column_name 值为valueb的那行数据，修改列column_b值为6

DataFrame数据拼接

pd.merge()

融合的意思，直接融合，数据不能融合进来，不能直接用，需要家outer参数

a=pd.DataFrame({'a':[1,2,3],'b':[2,3,4]})
b=pd.DataFrame({'a':[11,22,33],'c':[22,33,44]})
c=pd.merge(a,b)

通过验证发现，a和b的同名列表被合并，但是都是空说明默认连接形式是内连接，及二者默认把相同列名作为查找的条件，若是查找不到相同的值返回空。

加入连接条件

c=pd.merge(a,b,how='outer',on='a')
c

    a    b     c
0   1  2.0   NaN
1   2  3.0   NaN
2   3

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI算法网奇

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

订阅专栏

Pandas|DataFrame| DataFrame中的nan值处理

craftsman2020的博客

08-31

5929

DataFrame.dropna()方法的作用：是删除含用空值或缺失值得行或列。语法为：dropna（axis=0，how=‘any’，thresh=None，subset=None，inplace=False）axis:确定过滤的行或列，取值可以为(1) 0或index：删除包含缺失值的行，默认为0。(2) 1或columns：删除包含缺失值的列。how:确定过滤的标准，取值可以为：(1)any:默认值，如果存在NaN值，就删除该行或该列。//有一个就删除行或列。

pandas dataframe根据筛选结果修改值

呆萌的代Ma

03-19

3090

例：这个是根据列1 == '旧值'这个条件，将列2指定为新的值 df.loc[df[(df.列1 == '旧值')].index.tolist(),'列2'] = '新的值'

参与评论您还未登录，请先登录后发表或查看评论

dataframe的一些注意点筛选、去重合并

weixin_45271076的博客

08-10

540

bank_user=t[['user_id']]#筛选数用户id这一列并进行去重处理： bank_user=bank_user.drop_duplicates(subset='user_id',keep='first') bank_user.info() df1 = pd.merge(left = df_bill_train, right= df_loan_train, how = 'lef...

dataframe修改数据的方法

FF_02An的博客

03-14

4748

6、使用Series型数据来修改DataFrame列的值。7、对DataFrame中的不同列指定不同的替换方式。3、对整个DataFrame中的指定数据进行替换。5、对DataFrame列中的多个值进行修改。

pandas 进行数据筛选后再进行赋值操作 and（列类型转换）

a8131357leo的博客

03-14

2万+

原数据dataset在python里可以通过dataframe.loc[rowindex=,colindex=] 给整列赋值df.loc[:,'index'] = list(range(6))但是对于筛选过后的数据则不可以整体赋值，如果我只想为在b列中有值的record 写index 则会报错d = (df["b"].isna()==False).values #选出b列有值的行的list ...

python如何从一个dataframe提取相应的行组成一个新的dataframe_从Excel到Python：最常用的36个Pandas函数！最完整的Pandas教程！...

weixin_39756481的博客

11-19

1552

本文涉及pandas最常用的36个函数，通过这些函数介绍如何完成数据生成和导入、数据清洗、预处理，以及最常见的数据分类，数据筛选，分类汇总，透视等最常见的操作。生成数据表常见的生成数据表的方法有两种，第一种是导入外部数据，第二种是直接写入数据。Excel中的“文件”菜单中提供了获取外部数据的功能，支持数据库和文本文件和页面的多种数据源导入。Python支持从多种类型的数据导入。在开始使用Pytho...

python spark dataframe_pyspark dataframe 常用操作

weixin_39612023的博客

11-21

533

spark dataframe派生于RDD类，但是提供了非常强大的数据操作功能。当然主要对类SQL的支持。在实际工作中会遇到这样的情况，主要是会进行两个数据集的筛选、合并，重新入库。首先加载数据集，然后在提取数据集的前几行过程中，才找到limit的函数。而合并就用到union函数，重新入库，就是registerTemple注册成表，再进行写入到HIVE中。1、union、unionAll、unio...

python pandas dataframe 合并_python pandas dataframe 按列或者按行合并的方法

weixin_39716800的博客

11-30

2719

python pandas dataframe 按列或者按行合并的方法concat 与其说是连接，更准确的说是拼接。就是把两个表直接合在一起。于是有一个突出的问题，是横向拼接还是纵向拼接，所以concat 函数的关键参数是axis 。函数的具体参数是：concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=Non...

dataframe数据修改

weixin_54082927的博客

03-14

3351

使用DataFrame修改数据，包含方法、示例和注意事项。

【pandas】--DataFrame数据筛选（二）

panbaoran913的博客

12-17

1万+

dataframe的数据的选择和筛选

dataframe二维列表按条件筛选某个值并替换

yaoyahui6772的博客

12-15

3417

之前得到某传感器的数据，把异常值为900000，这样在处理数据的时候，需要将这个值替换为0. 刚开始的思路比较傻，两个for循环遍历二维列表，然后if条件筛选出900000后，替换为0. for i in range(len(data_list)): for j in range(len(data_list[0])): if data_list[i][j] == ‘900000.0’: data_...

【转载】使用Pandas对数据进行筛选和排序

aiqituo9030的博客

11-02

1万+

使用Pandas对数据进行筛选和排序本文转载自：蓝鲸的网站分析笔记原文链接：使用Pandas对数据进行筛选和排序目录： sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项获取金额最大前10项 Loc 单列数据筛选并排序多列数据筛选并排序按筛选条件求和(sumi...

对DataFrame中某一列数据进行修改的方法

热门推荐

li_0891的博客

07-12

10万+

下面介绍一种更改DataFrame中某一列数据的方法: 现将这一列数据通过列索引提取出来(此时提出来的部分为Series对象), 然后用map方法进行修改. (DataFrame中的applymap方法用得还不熟, 等研究过了再试试有没有另一种方法)代码:输出结果:...

pandas利用replace进行全部替换或者通过选择筛选后进行替换

longwei92的博客

10-22

3万+

# -*- coding: utf-8 -*- import pandas as pd #创建数据集 df = pd.DataFrame( { '名称':['产品1','产品2','产品3','产品4','产品5','产品6','产品7','产品8'], '数量':['A','0.7','0.8','0.4','0.7','B',...

dataframed的loc函数根据列筛选条件，改变另一列的值

Caiqiudan的博客

08-05

2436

错误示范： data1.loc[data1[data1['work_time'].isna()],'work_time'] = 'Unknow' 正确示范（转为index的布尔值）： data1.loc[data1['work_time'].isna(),'work_time'] = 'Unknow'

postgresql 一次插入多条记录_PostgreSQL中的JOIN方法概述

weixin_39989862的博客

11-27

632

作者：Kumar Rajeev Rastogi拉杰夫·拉斯托吉(Rajeev Rastogi)是Severalnines的客座作家。他目前是一名高级系统架构师，在从基于磁盘的关系数据库(如PostgreSQL)到分布式内存中的NoSQL数据库(如RAMCloud)等平台上的核心数据库开发方面拥有近15年的经验。Rajeev拥有计算机科学学位，并拥有十多项专利，他是开源社区的活跃成员，并定...

pandas 之 DataFrame筛选数据

u013402321的博客

05-17

1万+

import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(6, 4), columns=list('abcd')) df a b c d 0 -0.026429 -1.957159 1.365762 0.799437 1 -0.115957 1.38...

简述dataframe和series，以及二者关系