基本用法见下面的链接
https://blog.csdn.net/cckevincyh/article/details/78702674
一、去除重复数据
db.collection.aggregate([
{
$group: { _id: {condition: '$condition'},count: {$sum: 1},dups: {$addToSet: '$_id'}}
},
{
$match: {count: {$gt: 1}}
}
]).forEach(function(doc){
doc.dups.shift();
db.collection.remove({_id: {$in: doc.dups}});
})
这条去重语句通用,只需要改一处:将{condition: ‘$condition’}改成需要聚合的列
二、修改列名
db.collection.update(criteria,objNew,upsert,multi)
参数说明:
criteria:查询条件
objNew:update对象和一些更新操作符
upsert:如果不存在update的记录,是否插入objNew这个新的文档,true为插入,默认为false,不插入。
multi:默认是false,只更新找到的第一条记录。如果为true,把按条件查询出来的记录全部更新。
举例:
db.collection.update({}, {$rename : {"oldcolname" : "newcolname"}}, false, true)
将需要改的字段名(oldcolname)—>newcolname
三、导入导出数据(json)
打开cmd 直接输入命令即可
1. 导出数据模板:
mongoexport --host 远程服务器IP --port 远程服务器端口 --username 远程数据库用户名 --password 远程数据库密码 --db 数据库名 --collection 数据表名 --out /home/user/Public/table.json --fields colname,..,..
会自动导出默认_id字段
举例:
mongoexport --host 127.0.0.1 --port 27017 --db test --collection securityweek --out C:\Users\25511\myweixie\crawler_data\test.json --fields Address,Date
- 导入数据模板
mongoimport --db 本地数据库名 --collection 本地数据表 --file ~/table.json --type json
举例:
mongoimport --db test --collection test --file C:\Users\25511\myweixie\crawler_data\test.json --type json