mongodb更新数据,查找相同的id,有重复的,就更新。

最近在用mongodb保存一些爬虫的数据。遇到问题就是,需要把那些重复的数据更新,这个网站是滚动的,以前爬到的数据,同一个页面,可能现在有人回复了,页面的内容页就变了。向把以前保存过的数据再更新一下。不再重复保存。当然重复保存也可以,后期需要删除重复的数据。最好还是更新。

使用mongodb 的update_one命令可以实现这种功能。

比如:

import pymongo
client = pymongo.MongoClient()
db = client.db
collection = db.collection

data1 = {"tid":1, "name":"jeck", "post":"right", "reply":"null"}
data2 = {"tid":2, "name":"lucy", "post":"west", "reply":"yes"}
data11 = {"tid":1, "name":"jeck_nuan", "post":"wrong", "reply":"unsat"}
data22 = {"tid":2, "name":"lucy_johon", "post":"south", "reply":"sat"}

collection.insert_many([data1, data2])
list(collection.find())

collection.update_one({"tid":1}, {"$set":data11}, upsert=True)
list(collection.find())
collection.update_one({"tid":2}, {"$set":data22}, upsert=True).modified_count

res =collection.update_one({"tid":1}, {"$set":data11}, upsert=True)
res.modified_count
res = collection.update_one({"tid":2}, {"$set":data22}, upsert = True)
res.modified_count

update_one里的两个参数 都要用大括号,第一个大括号是表示query,查询是否有符合条件的记录。比如查询 tid 是1的记录。第二个大括号表示更新数据,可以更新单个键值,但是我选择更新整个记录。需要把整个记录传给 set。这样就可以得到需要的结果了。modified_count显示是否完成了更新。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值