根据某个字段查找重复数据--MySQL和MongoDB

最新推荐文章于 2023-02-28 15:00:43 发布

hupc

最新推荐文章于 2023-02-28 15:00:43 发布

阅读量507

点赞数

分类专栏： MySQL MongoDB 文章标签： mysql mongodb

原文链接：https://mp.weixin.qq.com/s/vVFUlXNYx2IDkIFDC4sZsw

版权

MySQL 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

MongoDB

1 篇文章 0 订阅

订阅专栏

记录一个在工作中遇到的一个场景：数据规则是根据某个字段作为唯一标识存储数据，但是在业务使用中发现有重复数据，需要把这些数据筛查出来。

下面分别以MySQL和MongoDB来举例说明：

MySQL

根据user表中的code字段查找重复数据

select code,count(*) from user group by code having count(*) > 1;

MongoDB

mongo中也是user表，根据code来找重复数据

db.getCollection('user').aggregate([    { $group: { _id : '$code', count: { $sum : 1 } } },    { $match: { count: { $gt : 1} } }])

注：如果Mongo表中数据量过多的话，这个语句直接查询可能会报错。报错如图所示：

原因是MongoDB的聚合的结果必须要限制在16M以内。所以要加一个参数allowDiskUse:true

所以，如果数据量多的话需要用下面的语句：

db.getCollection('user').aggregate([    { $group: { _id : '$code', count: { $sum : 1 } } },    { $match: { count: { $gt : 1} } }],{allowDiskUse:true})

the end~

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hupc

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

〖Python 数据库开发实战 - MongoDB篇⑮〗- MongoDB的索引机制

易编橙 · 终身成长社群，相遇已是上上签！

04-22

2万+

前面几章节我们掌握了 MongoDB 的 "增"、"删"、"改"、"查" 操作，该章节我们来了解一下 MongoDB 的索引机制。

〖Python 数据库开发实战 - MongoDB篇⑫〗- MongoDB集合的查询操作

最新发布

易编橙 · 终身成长社群，相遇已是上上签！

04-19

2万+

该章节我们将继续学习 MongoDB 的增删改查操作中的 "查询操作"，首先来看一下 MongoDB 对模糊查询的支持程度。

参与评论您还未登录，请先登录后发表或查看评论

使用aggregate在MongoDB中查询重复数据记录的方法

09-10

主要介绍了使用aggregate在MongoDB中查询重复数据记录的方法的相关资料,需要的朋友可以参考下

根据某一字段查询重复数据

weixin_44445986的博客

11-28

634

SELECT * FROM poetry_sentence where content in (select content from poetry_sentence group by content having count(content) > 1) and id not in (select min(id) from poetry_sentence group by content ...

根据某一条记录的两个字段查询表中重复记录

似水流年兮流年似水的博客

04-25

417

表：TEMP_CUSTG_IMPORT_DETAIL 查重字段：CONTACT_NAME、IDEN_NUM 根据某一条记录的两个字段查询表中重复记录方法一：IN SELECT * FROM TEMP_CUSTG_IMPORT_DETAIL A WHERE (A.CONTACT_NAME, A.IDEN_NUM) IN (SELECT CONTACT_NAME, ID...

MongoDB-查找表里面重复的记录

caixiangting的博客

02-17

2872

项目中使用的是mongodb数据库，在测试数据入库的时候，会根据源数据，然后生成一个自增的id到数据库里面，然后线上和测试环境针对同一条数据的id是不一致的。有重复的数据又会导致正常执行etl任务会报错，因此，需要查询出在mongodb里面某个字段重复的记录。在chatpgt还没有出现之前，针对这种复杂的语句，自己要去百度学习他的用法，会稍微有点复杂，也可以使用studio3t的付费版，上面支持直接写mysql语法格式的sql进行查询，也可以帮你转换为mongo的js查询语法的语句。

MongoDB数据重复解决方案

weixin_34357267的博客

05-24

955

当我们在测试阶段时难免会出现一些程序写错，导致数据重复，本人因为这个问题，倒腾了几天，刚开始的思路是写脚本，因为自己语言学的太菜，导致连一个定义的公式都没想出来，后来是利用MongoDB里面的聚合解决的。　　下面我以一个小实例来讲把：不难看出，姓名有出现重复的现象，少的情况我们可以逐个删除，当数据量达到几百万，几千万的时候估计大家有些发愁了，应该会有些朋友会想到写脚本去筛选然后删除这...

mongodb和mysql如何关联_MongoDB里做表间关联

weixin_33525438的博客

02-03

1623

MongoDB与关系型数据库的建模还是有许多不同，因为MongoDB支持内嵌对象和数组类型。MongoDB建模有两种方式，一种是内嵌(Embed)，另一种是连接(Link)。那么何时Embed何时Link呢？那得看两个实体之间的关系是什么类型。一对一的关系：Embed，比如用户信息集合有Address字段，Address字段有省、市、县三个字段。在关系型数据库中，通过连接运算符可以实现多个表联合查...

MongoDB中数据的替换方法实现类Replace()函数功能详解

09-08

在MongoDB中，替换数据的方式与传统的关系型数据库（如SQL Server或MySQL）有所不同。本篇文章将深入探讨如何在MongoDB中实现类似于SQL的替换功能，特别是通过`Replace()`函数的替代方法。在SQL Server中，`...

MongoDB和MySQL区别，及MongoDB基础操作

xie746498_的博客

08-05

747

随着互联网web2.0网站的兴起，传统的关系数据库在处理web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，出现了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。MongoDB是一款为web应用程序和互联网基础设施设计的数据库管理系统。MongoDB是NoSQL类型的数据库。.........

【常用SQL】MySQL查询重复的数据

千寻简笔记《chihiro-notes》已开源|公众号：千寻简

02-28

7427

查询仅检查一个列的重复数据。如果您想要检查多个列的组合是否重复，请在GROUP BY子句中包含这些列的名称。列的值进行分组，并计算每个值的出现次数。然后使用HAVING子句过滤出现次数大于1的组，这些组中的行即为重复数据。列的值进行分组，并计算每个组的出现次数。然后使用HAVING子句过滤出现次数大于1的组，这些组中的行即为重复数据。查询重复的数据可以使用SQL中的GROUP BY和HAVING子句。以下是一个示例查询，可以检查名为。

MySQL如何查询表中重复的数据

amberom的专栏

12-10

1万+

推荐方法2，简洁且运行速度快；方法3不推荐，需要全部字段筛选出来，运行速度慢。

mongodb + golang 聚合查询统计某个字段重复的次数

striveQiao

03-02

1729

统计数据源目的：统计其中每个taggerId出现的次数； golang的pipeLine查询结构：采用mongo官方go driver pipeLine := mongo.Pipeline{ //{{"$match", bson.D{{"status", "A"}}}}, {{"$group", bson.D{{"_id", "$taggerId"}, {"total", bson.D{{"$sum", 1}}}}}}, {{"$sort", bson.D{{"total", -1}}}}

mysql查询出表中相同的数据以及相同数据共有多少条

yangyongming_888的博客

10-09

1万+

select phone,count(*) as count from app_user group by phone having count>1;

mongoengine数据查询

python_tty的专栏

08-27

2252

模型示例： class Address(EmbeddedDocument): country = StringField(require=True) class User(Document): email = StringField(required=True) first_name = StringField(max_length=50) last_na...

【已解决】MongoDB 中根据指定字段筛选出具有重复值的记录

华仔仔的博客

04-19

6559

在业务场景中遇到这样一个问题，根据某个字段进行条件查询出来的记录总数与后端 MongoDB 数据库中记录总数出现不一致的情形，经过分析之后发现是因为数据库中某个唯一字段的值重现重复的情况，导致了有多条重复的记录存在。因此，解决方法就是先筛选出指定字段有重复值的记录，再进行删除操作。因为使用的是 MongoDB 数据库，因此需要用到 MongoDB 相关的执行命令，这与 MySQL 中相关操作语句有较大差别，针对本问题的解决方法的执行命令如下： db.getCollection('host').aggreg

MongoDB查询表中相同字段与删除字段重复数据

liu911025的博客

07-02

6366

1.查询表中相同字段查询表中字段为'bqyId'相同的字段db.resToMinPrice.aggregate([{'$group':{ '_id':{'bqyId':'$bqyId'}, 'uniqueIds':{'$addToSet':'$_id'},...