使用python从一个列表中寻找不在另一个列表中的数据的方法

he-yin

已于 2024-08-30 11:45:58 修改

阅读量6.6k

点赞数 3

分类专栏： python 文章标签： python

于 2020-03-11 11:31:21 首次发布

本文链接：https://blog.csdn.net/HYESC/article/details/104792744

版权

python 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

假设有以下两个数据集列表

a = list(range(1, 100000))
b = list(range(150000, 50000, -1))

要从a中找到不在b中的数据，常常会想直接遍历两个列表即可

a_alone = []

start = time.time()
for i in a:
    if i not in b:
        a_alone.append(i)
end = time.time()

print(end - start)  # 117s

可以看到效率是非常低下的，相当于O(n2)的时间复杂度

利用集合则能大幅提高效率

a_set = set(a)
b_set = set(b)

start = time.time()
# 求差集得到的是在a里但不在b里的数据集合，a独有
# 如果a，b不是空集合，a-b为空集合，说明a中的数据全部在b中
a_alone = a_set - b_set

end = time.time()

print(end - start)  # 0.003s

效率大幅提升，相当于O(n)的时间复杂度（不清楚python的set实现机制，该处根据java中hashSet实现机制进行的推测）

集合的一些其他操作

# 求并集
c_set = a_set | b_set

# 求交集，结果集如果为空，说明两个集合没有任何数据是相同的
d_set = a_set & b_set

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

he-yin

关注关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python按条件读写Excel表中的数据 v2.0

12-20

Python读取Excel表中数据，并按条件判断两个表中单元格汇总数据是否相等，相等则把对应的数据写入其中一个表中对应的单元格中。更简洁详细的代码以及分析文档可看v4.0版本

Python在一个列表中查找不在另一个列表中的元素

热门推荐

ainivip的专栏

05-28

1万+

一、问题场景：要比较两个列表list_A、list_B，以便创建一个新列表，新列表中存储list_B元素没有出现在list_A中的内容。例如： new_list=[] list_A=["a", "b", "c", "d", "e"] list_B=["b", "d", "f", "m"] 结果应该是： new_list=["f", "m"] 二、分析思路：方案一：利用列表循环的方法，将list_B中的元素在list_A中进行循环查找，将不再列表list_A中的元素识别出来，这个方案

参与评论您还未登录，请先登录后发表或查看评论

【面试编程题】5- 给定两个数组，找出在数组a里面，不在数组b里的元素

奥斯卡带你飞

07-26

1540

问题：给定两个列表，找出在数组a中，不在数组b中的元素？思路分析：也就是说要找出单独存在的元素：假设两个列表a和b 比如需要找出这个元素出现在a列表中，但是在b列表中这个元素是不存在的； def alone_str(alist, blist): res = [x for x in alist if x not in blist] return list(set(res)) a = [1,1,2,3,3,6,'a'] b = [1,4,'a','b'] print(alone_

对照两个Excel表格，判断第一个表格的数据是否存在第二个表格中

菜鸟的博客

04-14

5272

室友今晚拖着疲惫的身躯回到出租屋。他脸色苍白，面容憔悴，一问之下他说今天公司很多事情做。还有一件事让他很苦恼，那就是boss给了他两张表格，数据类型是一样的，让他找到在第一张表格里存在而第二张表格里不存在的数据。路见不平，拔刀相助，要不就写几行简单的python脚本来帮一下可怜的孩子吧…… 首先，先安装读取xlsx文件的模块xlrd pip install xlrd 接着就是pytho...

python | 判断集合是否在另一个集合中

ASKCOS博客

09-16

2015

a = {1,2,3,4} b = {2,3} b <= a True b = {2,3,5} b <= a False

python 返回一个列表中第二大的数方法

09-19

在Python编程语言中，有时我们需要从一个列表中找出第二大（次大）的元素。这个问题在很多数据处理场景中都有实际应用，例如数据分析、算法竞赛或者简单的数据排序。本篇文章将详细解析如何使用Python来实现这一功能...

python从list列表中选出一个数和其对应的坐标方法

09-19

本文将详细介绍如何在Python中从一个二维列表中选取特定值及其对应的坐标。这通常涉及到对列表的遍历以及条件判断，有时还需要利用NumPy库来提高操作效率。 #### 例1：选择特定值及其对应的坐标假设有一个二维列表...

Python，演示了如何找出一个列表中的众数

最新发布

03-28

在Python编程语言中，"众数"是指一个数据集中出现次数最多的数值。众数可以用于数据分析，特别是在统计学和机器学习领域，它可以帮助我们理解数据的分布情况。本主题将详细探讨如何在Python中找到一个列表的众数。 ...

python实现列表中由数值查到索引的方法

12-25

您可能感兴趣的文章:python 寻找list中最大元素对应的索引方法Python 列表(List)操作方法详解python获取元素在数组中索引号的方法python通过索引遍历列表的方法numpy中实现ndarray数组返回符合特定条件的索引方法...

python的列表List求均值和中位数实例

09-17

在Python中，对于简单的列表，计算均值可以手动进行，但当数据集较大时，使用numpy库会更有效率。以下是一个例子： ```python import numpy as np a = [2, 4, 6, 8, 10] average_a = np.mean(a) ``` 在这个例子中...

python数据处理——dataframe里的行列分割

m0_37876745的博客

06-27

7272

有时候会遇到一种情况，就是在dataframe的某一列中是比较复杂的数据结构，比如一个dict，或者一个list，或者一个list of list，其实都有很好的办法可以解决的，不需要用多重的for循环，这里放两个例子： Splitting a list in a Pandas cell into multiple columns 源dataframe df = pd.DataFrame(...

python如果选择不在列表里,Python在一个列表中查找不在另一个列表中的元素

weixin_31052141的博客

11-21

305

I need to compare two lists in order to create a new list of specific elements found in one list but not in the other. For example:main_list=[]list_1=["a", "b", "c", "d", "e"]list_2=["a", "f", "c", "m...

python list 差集

牛奔的博客

02-24

960

前言有时候我们希望基于list得到一个集合C，该集合C的元素可以被描述为元素在集合A中而不在集合B中。即：差集。基于set A = [1, 2, 3] B = [2, 3, 4] C = set(A) - set(B) 但是这样结果也是set类型基于推导式 A = [1, 2, 3] B = [2, 3, 4] C = [i for i in A if not i in B] ...

python如果选择不在列表里_在python中只选取列表中某一纵列的方法

weixin_39861918的博客

11-24

788

在python中只选取列表中某一纵列的方法如下所示：>>> a=random.randint(1,6,(5,3))>>> aarray([[5, 3, 1],[5, 5, 1],[5, 1, 3],[1, 4, 3],[5, 1, 2]])>>> b=a.tolist()>>> b#选取b列表的前2列[[5, 3, 1], [5, 5, 1], [5, 1, 3], [1, 4, 3], [5, ...

pandas使用query函数查询dataframe指定数据列的内容（数值）不包含在特定列表中的数据行（not contain in list)

data+scenario+science+insight

02-28

1335

pandas使用query函数查询dataframe指定数据列的内容（数值）不包含在特定列表中的数据行（select rows which column values are not contained in a list）

python：pandas中dataframe的基本用法汇总

0x8g1T9E-

07-14

9133

更加详细的内容可以查看：https://blog.csdn.net/hhtnan/article/details/80080240（基本函数整理） https://blog.csdn.net/LY_ysys629/article/details/54428838 https://www.cnblogs.com/timotong/p/9678490.html 一. DataFrame的创建　　创建一个空的dataframe 1 df=pd.DataFram...

python获取excel数据并移动到新表

m0_37570494的博客

01-27

2410

思路： 1、操作本地excel获取数据； 2、对数据进行操作并存储（看是否去重） 3、将处理后的数据写入新表操作： 1、操作本地excel获取数据：后面添加新表的时候，需要添加下面几个步骤，来保证找到重复数据之后的处理：原表：最终结果：里面有个关键点，就是openpyxl，适用于只适用于新版的xlsx，如果用其他格式会报错。原文为此文章：老板让我从几百个Excel中查找数据，我用Python一分钟搞定！自己尝试里面的操作并不能满足其文章描述需求 ...

使用Python批量查看A电子表格的数据不包含在B电子表格中数据

chinacnd的博客

06-16

553

最近，单位同事需要知道30多个电子表格中的数据是否包含在一个基础表中，需要依次将30多个电子表格依次与基础表进行包含关系的进行处理，每个电子表格中有3多条数据与基础表的8万多条数据进行包含关系的处理，如此大的数据量处理，不用Python，真的很难。还好有之前的相同的数据处理经历，我很快就编写好了代码，同事把电子表格发给我，运行代码，喝咖啡，接下来等待收获果实了。......

python输出数组a存在b数组不存在的元素_Python学习笔记（1）——数组差集

weixin_39685459的博客

12-15

2235

面试的时候被问到这样一个问题：有A、B两个数组，找出B中有A中没有的所有元素(换言之即是求差集B-A)。当时比较紧张，用了最原始的双重嵌套循环逐个比较，很显然这种时间复杂度高达O(n2)的算法相当low。回去之后经过思考，有了一个新的思路，即先对A、B进行排序，时间复杂度为O(nlog2n)，再对排序后的数组同时遍历进行比较，这里的时间复杂度为O(n)，这样总体的时间复杂度为O(nlog2n)，效...

python寻找一个列表数据的波谷

03-31

该函数接受一个列表作为参数，遍历列表中的元素，如果该元素小于前一个元素和后一个元素，则被判断为一个波谷，并将其添加到一个列表中。最后返回这个列表。例如，输入一个列表 [5, 3, 9, 8, 2, 7, 4, 1]，输出一...