python duplicated函数_Python Pandas Dataframe.duplicated()用法及代码示例

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

数据分析的重要部分是分析重复值并将其删除。 Pandas duplicated()方法仅有助于分析重复值。它返回一个布尔序列,仅对唯一元素而言为True。

用法:

DataFrame.duplicated(subset=None, keep='first')

参数:

subset:取得一列或列标签列表。默认值为无。传递列后,它将仅将它们视为重复项。

keep:控制如何考虑重复值。它只有三个不同的值,默认值为“第一”。

->如果为“第一个”,则它将第一个值视为唯一值,并将其余相同的值视为重复值。

->如果为“ last”,则它将last值视为唯一值,并将其余相同的值视为重复值。

->如果为False,则将所有相同的值视为重复项。

要下载使用的CSV文件,请单击此处。例1:返回布尔序列

在下面的示例中,根据“名字”列中的重复值返回布尔系列。

# importing pandas package

import pandas as pd

# making data frame from csv file

data = pd.read_csv("employees.csv")

# sorting by first name

data.sort_values("First Name", inplace = True)

# making a bool series

bool_series = data["First Name"].duplicated()

# displaying data

data.head()

# display data

data[bool_series]

输出:

如输出图像中所示,由于keep参数的默认值为“ first”,因此,无论何时出现名称,第一个都将被视为“唯一”,并且会被视为“重复”。

范例2:删除重复项

在此示例中,keep参数设置为False,以便仅采用唯一值,并从数据中删除重复值。

# importing pandas package

import pandas as pd

# making data frame from csv file

data = pd.read_csv("employees.csv")

# sorting by first name

data.sort_values("First Name", inplace = True)

# making a bool series

bool_series = data["First Name"].duplicated(keep = False)

# bool series

bool_series

# passing NOT of bool series to see unique values only

data = data[~bool_series]

# displaying data

data.info()

data

输出:

由于duplicated()方法对于重复项返回False,因此采用该系列的NOT来查看数据帧中的唯一值。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于计算机专业的学生而言,参加各类比赛能够带来多方面的益处,具体包括但不限于以下几点: 技能提升: 参与比赛促使学生深入学习和掌握计算机领域的专业知识与技能,如编程语言、算法设计、软件工程、网络安全等。 比赛通常涉及实际问题的解决,有助于将理论知识应用于实践中,增强问题解决能力。 实践经验: 大多数比赛都要求参赛者设计并实现解决方案,这提供了宝贵的动手操作机会,有助于积累项目经验。 实践经验对于计算机专业的学生尤为重要,因为雇主往往更青睐有实际项目背景的候选人。 团队合作: 许多比赛鼓励团队协作,这有助于培养学生的团队精神、沟通技巧和领导能力。 团队合作还能促进学生之间的知识共享和思维碰撞,有助于形成更全面的解决方案。 职业发展: 获奖经历可以显著增强简历的吸引力,为求职或继续深造提供有力支持。 某些比赛可能直接与企业合作,提供实习、工作机会或奖学金,为学生的职业生涯打开更多门路。 网络拓展: 比赛是结识同行业人才的好机会,可以帮助学生建立行业联系,这对于未来的职业发展非常重要。 奖金与荣誉: 许多比赛提供奖金或奖品,这不仅能给予学生经济上的奖励,还能增强其成就感和自信心。 荣誉证书或奖状可以证明学生的成就,对个人品牌建设有积极作用。 创新与研究: 参加比赛可以激发学生的创新思维,推动科研项目的开展,有时甚至能促成学术论文的发表。 个人成长: 在准备和参加比赛的过程中,学生将面临压力与挑战,这有助于培养良好的心理素质和抗压能力。 自我挑战和克服困难的经历对个人成长有着深远的影响。 综上所述,参加计算机领域的比赛对于学生来说是一个全面发展的平台,不仅可以提升专业技能,还能增强团队协作、沟通、解决问题的能力,并为未来的职业生涯奠定坚实的基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值