python数组重复数据去重_Python列表重复数据消除的四种方法及其性能比较,去,4,方式,对比...

最新推荐文章于 2024-07-08 20:49:05 发布

weixin_39637614

最新推荐文章于 2024-07-08 20:49:05 发布

阅读量1.2k

点赞数

文章标签： python数组重复数据去重

本文介绍了Python中四种去除列表重复数据的方法：新建数组去重、集合转化去重、dict.fromkeys()去重以及OrderedDict去重，并通过性能测试对比了它们的效率。在Python3.6以上，dict.fromkeys()能保留顺序且性能较好，而在Python3.6以下，可以使用OrderedDict.fromkeys()。

摘要由CSDN通过智能技术生成

列表去重是Python中一种常见的处理方式，任何编程场景都可能会遇到需要列表去重的情况。

列表去重的方式有很多，本文将一一讲解他们，并进行性能的对比。

让我们先制造一些简单的数据，生成0到99的100万个随机数：

from random import randrange

DUPLICATES = [randrange(100) for _ in range(1000000)]

接下来尝试这4种去重方式中最简单直观的方法：

1.新建一个数组，遍历原数组，如果值不在新数组里便加入到新数组中。

# 第一种方式

def easy_way():

unique = []

for element in DUPLICATES:

if element not in unique:

unique.append(element)

return unique

进入ipython使用timeit计算其去重耗时：

%timeit easy_way()

# 1.16 s ± 137 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

平均耗时在1.16秒左右，但是在这个例子中我们使用了数组作为存储对象，实际上如果我们改成集合存储去重后的结果，性能会快不少：

def easy_way():

unique = set()

for element in DUPLICATES:

if element not in u

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39637614

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python二维数组去重_np.unique()对一维和二维数组去重

weixin_39895881的博客

12-30

3289

一维数组对一维数组或列表，unique()函数去除其中重复元素，并按元素大小返回一个新的无重复元组或列表。import numpy as npA = [1, 2, 2, 5,3, 4, 3]a = np.unique(A)print(a)[1 2 3 4 5]C= ['fgfh','asd','fgfh','asdfds','wrh']c= np.unique(C)print(c)['asd' '...

对python中两种列表元素去重函数性能的比较方法

09-20

今天小编就为大家分享一篇对python中两种列表元素去重函数性能的比较方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

参与评论您还未登录，请先登录后发表或查看评论

Python 列表去重的4种方式及性能对比

Python实用宝典网

10-26

1129

列表去重是Python中一种常见的处理方式，任何编程场景都可能会遇到需要列表去重的情况。列表去重的方式有很多，本文将一一讲解他们，并进行性能的对比。让我们先制造一些简单的数据，生成0到9...

【python重复元素判定】

最新发布

qq_36253366的博客

07-08

759

对于大多数情况，使用集合（Set）是最简单且高效的方法。如果需要保持原始顺序，且列表长度不大，可以考虑遍历列表的方法。对于需要计算重复次数的场景，可以使用。除了之前提到的几种方法外，Python中判定序列中是否存在重复元素的方法还可以从其他角度进行探索，但核心思想大多围绕“去重”和“计数”两个方向。在实际应用中，推荐使用集合（Set）、字典（或Counter）、排序后遍历以及遍历列表时检查子列表等方法来检测重复元素。这些方法各有优缺点，具体选择哪种方法取决于具体的应用场景和性能要求。

python list去重函数_python中对list去重的多种方法

weixin_39981400的博客

11-22

198

今天遇到一个问题，在同事随意的提示下，用了itertools.groupby这个函数。不过这个东西最终还是没用上。问题就是对一个list中的新闻id进行去重，去重之后要保证顺序不变。直观方法最简单的思路就是：代码如下:ids = [1,2,3,3,4,2,3,4,5,6,1]news_ids = []for id in ids:if id not in news_ids:news_ids.appe...

python list去重函数_Python基础中的集合，函数——06

weixin_39605578的博客

11-24

126

集合python中的集合由不同的元素组成(去重，没有重复的元素)s = set('hello')print(s)#结果是：s = {'h', 'o', 'e', 'l'}集合中的元素是无序排列的每个元素必须是不可变类型（如：数字、字符串、元组）增加集合元素s.add(3)清空集合s.clear()删除集合元素s.pop()#随机删除s.remove(3)#指定删除，不存在该元素时删除会报错s.di...

python list去重函数_python中对list去重的几种方法

weixin_39801991的博客

11-24

1204

这篇文章主要介绍了python中对list去重的多种方法，现在分享给大家，需要的朋友可以参考下今天遇到一个问题，在同事随意的提示下，用了 itertools.groupby 这个函数。不过这个东西最终还是没用上。问题就是对一个list中的新闻id进行去重，去重之后要保证顺序不变。直观方法最简单的思路就是：复制代码代码如下:ids = [1,2,3,3,4,2,3,4,5,6,1]news_ids...

python 去除二维数组/二维列表中的重复行方法

09-19

在Python编程中，处理数据时有时需要去除二维数组或二维列表中的重复行。二维数组，通常指的是numpy数组，而二维列表则是由多个列表组成的列表。本文将详细介绍如何在Python中去除这些结构中的重复行。首先，我们...

Advanced Data Type _day.zip_Python数据处理_python_sleptq2u_数据处理 pyth

09-23

例如，可能包含如何使用列表推导式进行数据转换，如何使用字典进行数据查找，如何利用集合进行数据去重，以及如何运用numpy数组进行矩阵运算和统计分析。同时，还会涉及pandas DataFrame的创建、索引、切片、合并和...

python list去重函数_Python中List的去重问题

weixin_39695701的博客

11-24

127

Python中的去重问题，这或许是个简单的问题。比如一个list：a = [1,3,2,9,5,3,1,5]，如何删除重复元素，嗯，有一个高端的方法：#方法一a = set(a)a:1, 2, 3, 5, 9.哇，好高端，事情可没这么简单，观察，a的顺序变的，类型也变了print a,type(a)set([1, 2, 3, 5, 9]) a变成了python里面的集合类型，顺序且无重复元素，跟s...

python3中对list去重

Ordinary programmer

11-12

1229

1，去重后顺序会改变 ids = [1,4,3,3,4,2,3,4,5,6,1] ids = list(set(ids)) 2，去重后顺序不改变 orgList = [1,0,3,7,7,5] formatList = list(set(orgList)) formatList.sort(key=orgList.index) print(formatList) ...

Python列表去重的方式有很多，了解它们，进行性能的对比

Python案例分享，B站视频教程：https://space.bilibili.com/523606542

10-27

223

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理以下文章来源于Python 实用宝典，作者Python 实用宝典前言列表去重是Python中一种常见的处理方式，任何编程场景都可能会遇到需要列表去重的情况。列表去重的方式有很多，本文将一一讲解他们，并进行性能的对比。让我们先制造一些简单的数据，生成0到99的100万个随机数： from random import randrange DUPLICA..

List去重

black_的博客

08-19

315

package cn.java.test; import java.util.ArrayList; import java.util.HashSet; import java.util.List; import java.util.stream.Collectors; import org.junit.Test; /** * list去重 * @author Administrator...

【13】python列表去重/寻找一个文件夹中的所有文件/函数返回多个值

cdan134的博客

10-19

453

1,去重思路：遍历列表，将不予列表该指针前面的数值相同的数值复制给新的列表 a = [1,2,3,3,4,5,5,5,5,5,6,7] b = [] # temp = 1 for i in range(len(a)): for j in range(i): if a[i] == a[j]:

python去重复排序_Python3实现从排序数组中删除重复项算法分析

weixin_39609573的博客

11-26

249

本文实例讲述了Python3实现从排序数组中删除重复项算法。分享给大家供大家参考，具体如下：题目：给定一个排序数组，你需要在原地删除重复出现的元素，使得每个元素只出现一次，返回移除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。方案一:利用set()快速剔除重复元素。效率最高# -*- coding:utf-8 -*-#! python3...

list去重排序

cyy356的博客

08-14

608

实体对象 public class User { private int id; private String username; private String password; private Date createTime; public User(int id, String username, String password, Date crea...

Python 对数组去重：

weixin_72296707的博客

04-11

3726

为了删除重复项，我们将给定的 NumPy 数组传递给 unique() 方法，它将返回唯一数组。lexsort() 是间接稳定排序，lexsort() 接受一个排序键数组，可以将其解释为 numpy 数组中的列，lexsort 返回一个整数索引数组，该数组描述了多列的排序顺序。给定一个一维数组，对于数组中的每个元素，我们将检查它是否在数组中重复，如果重复，我们将删除该元素，否则我们将保留它。给定一个二维数组，对于数组中的每个数组，我们将检查它是否在数组中重复，如果重复，我们将删除数组，否则我们将保留它。

python去除数组重复项_Python中数组的通用数据项和方法

cumubi7552的博客

06-28

1561

python去除数组重复项List of common and most useful data items and methods of an array module in python python数组模块的常见和最有用的数据项和方法列表 Sr No Data Item/Method Description Example (Consider a is array name) ...

Python数组去重

06-19

在 Python 中，数组（列表）去重有多种方法。以下是几种常见的去重方式： 1. 列表推导式： ```python def remove_duplicates(input_list): return list(set(input_list)) # 示例 input_array = [1, 2, 2, 3, 3, 3] unique_array = remove_duplicates(input_array) print(unique_array) # 输出: [1, 2, 3] ``` 2. 使用 `dict`（字典）：字典的键是唯一的，所以可以把列表元素作为字典的值来去除重复。 ```python def remove_duplicates_dict(input_list): return list(dict.fromkeys(input_list)) # 示例 input_array = [1, 2, 2, 3, 3, 3] unique_array = remove_duplicates_dict(input_array) print(unique_array) # 输出: [1, 2, 3] ``` 3. 使用 `set`（集合）：集合也是不允许重复元素的，可以先转换为集合再转换回列表。 ```python def remove_duplicates_set(input_list): return list(set(input_list)) # 示例 input_array = [1, 2, 2, 3, 3, 3] unique_array = remove_duplicates_set(input_array) print(unique_array)