mongodb更新数据,查找相同的id,有重复的,就更新。

最近在用mongodb保存一些爬虫的数据。遇到问题就是,需要把那些重复的数据更新,这个网站是滚动的,以前爬到的数据,同一个页面,可能现在有人回复了,页面的内容页就变了。向把以前保存过的数据再更新一下。不再重复保存。当然重复保存也可以,后期需要删除重复的数据。最好还是更新。

使用mongodb 的update_one命令可以实现这种功能。

比如:

import pymongo
client = pymongo.MongoClient()
db = client.db
collection = db.collection

data1 = {"tid":1, "name":"jeck", "post":"right", "reply":"null"}
data2 = {"tid":2, "name":"lucy", "post":"west", "reply":"yes"}
data11 = {"tid":1, "name":"jeck_nuan", "post":"wrong", "reply":"unsat"}
data22 = {"tid":2, "name":"lucy_johon", "post":"south", "reply":"sat"}

collection.insert_many([data1, data2])
list(collection.find())

collection.update_one({"tid":1}, {"$set":data11}, upsert=True)
list(collection.find())
collection.update_one({"tid":2}, {"$set":data22}, upsert=True).modified_count

res =collection.update_one({"tid":1}, {"$set":data11}, upsert=True)
res.modified_count
res = collection.update_one({"tid":2}, {"$set":data22}, upsert = True)
res.modified_count

update_one里的两个参数 都要用大括号,第一个大括号是表示query,查询是否有符合条件的记录。比如查询 tid 是1的记录。第二个大括号表示更新数据,可以更新单个键值,但是我选择更新整个记录。需要把整个记录传给 set。这样就可以得到需要的结果了。modified_count显示是否完成了更新。

access是一种常见的关系型数据库管理系统,它提供了处理重复数据的多种方法。 首先,可以通过使用查询功能来查找和清理重复数据。在查询设计视图中,可以使用“删除重复记录”查询来删除重复的记录。该查询可以根据特定字段(如ID或日期)来查找重复记录,并删除额外的副本。此外,还可以使用“查找重复记录”查询来查找具有相同值的记录。这样可以快速定位并处理重复数据。 其次,可以使用表的主键或唯一索引来防止重复数据的插入。通过在表中定义主键或唯一索引,可以确保每条记录的关键字段(如ID或名称)具有唯一的值。当试图插入具有相同关键字段值的记录时,Access会发出错误提示,并阻止插入重复数据。 此外,还可以使用数据验证规则来限制字段中的重复数据。通过在字段属性中定义数据验证规则,可以要求字段的值在整个表中是唯一的。这样,当试图插入重复数据时,Access会发出警告并阻止插入。 最后,可以利用Access提供的数据重复项查询功能来查找并删除重复数据。在查询设计视图中,可以使用内置的“查找重复项”查询来查找具有相同值的记录,并对其进行处理(如删除、更新或合并)。 总而言之,通过使用Access提供的查询、索引、数据验证规则和重复项查询功能,可以有效地处理和清理重复数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值