模糊查询:
body中包含:
db.getCollection('test').find({body:{$regex: /骗子/}})
body或title中包含:
db.getCollection('test').find({$or:[{body:{$regex: /骗子/}},{title:{$regex: /骗子/}}]})
想继续查符合这些条件的一共有多少条数据直接在后面.count(),就行了,适合数据量不太大的把,我的数据量非常大,会卡死,要在python里查:
results=collection_domain.count_documents({'body':{'$regex': '软件'}})
查询结果插入到新表中, python中:
result = list(collection_domain.find({'title':{'$regex':'骗子'}}))
collection_key.insert_many(result)
mongo中:(有重复id的直接跳过了)
var result=db.getCollection('testApp').find({'body':/虚假/})
while(result.hasNext()) db.getCollection('containKey').insert(result.next())
查询重复字段的值:
user = collection_test.aggregate(
[{'$group':{
'_id':'$name',
'count' : {'$sum': 1}
}},
{'$match': {
'count': {'$gt': 1}
}}]
)
在python中还需要转化为list做之后的处理: user = list(user)