notepad++去除重复行 python去除重复数据

1. notepad++ 去除重复行

  1. 编辑->行操作
  2. 升序排列文本行
  3. 第一种(从重复行中保留一行):删除重复行
    第二种(删除重复行,包含本身):1. 替换;2. 查找目标:^(.*\r?\n)\1+;替换为: 空,不填写内容

2. pandas 删除csv中重复行

1) 代码

import pandas as pd

# 读取CSV文件
df = pd.read_csv('your_file.csv')

# 删除重复行
df = df.drop_duplicates()

# 将处理后的数据保存回CSV文件
df.to_csv('your_output_file.csv', index=False)

2) drop_duplicates()方法参数介绍

subset: 指定要考虑的列(或列的组合),即基于哪些列判断是否为重复行。默认为所有列。

df.drop_duplicates(subset=['column1', 'column2'])

keep: 控制保留哪个重复行。可选值有:
‘first’(默认值): 保留第一次出现的重复行。
‘last’: 保留最后一次出现的重复行。
False: 删除所有重复行。

df.drop_duplicates(keep='last')

ignore_index: 重置索引,以便新的DataFrame具有默认的整数索引。

df.drop_duplicates(ignore_index=True)

inplace: 是否在原地修改DataFrame,而不是返回一个新的DataFrame。

df.drop_duplicates(inplace=True)

3. list 删除列表中重复元素

my_list = [1, 2, 2, 3, 4, 4, 5]
unique_list = list(set(my_list))
print(unique_list)
  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值