Dataframe数据类型相关问题汇总及处理方法

本文介绍了如何在PandasDataFrame中,使用lambda函数和isinstance()方法根据不同数据类型(int和object)处理一列数据。非int类型的值通过split()获取第一个元素后转换为int64类型。
摘要由CSDN通过智能技术生成

1. dataframe结构下有一列数据,有一部分是int类型,另一部分是object类型。当数据是int类型时,返回其本身,当是object类型时,采用其他处理方式;

使用lambda 和isinstance来实现:

isinstance(x,int),判断是否是int类型

lambda(x: true_return if 条件 else false_return ),其中true_return:条件为真时,返回的内容;false_return:条件为假时,返回的内容

df['col_name'].apply(lambda x:x if isinstance(x,int) else x.split('~')[0]).astype('int64')

上面代码展示了如果不是int类型就分割x取第一个值,然后调整整列数据为‘int64’

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DataFrame是Pandas库中最常用的数据结构之一,它类似于Excel表格,由多行多的数据组成。下面介绍一些DataFrame常用的方法: 1. head()和tail()方法:分别返回DataFrame的前几行和后几行数据,默认返回前/后五行。 2. info()方法:查看DataFrame的基本信息,包括名、数据类型、非空值数量、内存占用等。 3. describe()方法:返回DataFrame的基本统计信息,包括计数、平均值、标准差、最小值、最大值等。 4. shape属性:返回DataFrame的行数和数。 5. columns属性:返回DataFrame名。 6. index属性:返回DataFrame的索引。 7. loc[]方法:通过标签定位数据,例如df.loc[0]表示返回第一行数据。 8. iloc[]方法:通过位置定位数据,例如df.iloc[0]表示返回第一行数据。 9. drop()方法:删除指定行或,需要指定axis参数,axis=0表示删除行,axis=1表示删除。 10. drop_duplicates()方法:去重,可以指定去重的。 11. groupby()方法:按照指定进行分组,可以对分组后的数据进行聚合操作,例如求平均值、求和等。 12. merge()方法:合并多个DataFrame,需要指定合并的。 13. pivot_table()方法:创建数据透视表,用于对数据进行汇总和分析。 14. apply()方法:对DataFrame中的每个元素应用指定的函数。 15. sort_values()方法:按照指定排序。 16. set_index()方法:将指定设置为索引。 这些方法只是DataFrame中的一部分常用方法,还有很多其他方法可以根据需要使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值