- 博客(3)
- 收藏
- 关注
原创 管道操作删除 MongoDB 重复数据
前言由于 MongoDB 约束性比较小,所以有时候数据库中会有很多重复的数据,特别是爬虫的数据。文档数量一旦达到一定数据量级,为了保证新插入的数据不重复,如果每次使用 update 操作感觉有点慢,倒不如一次性 insert 然后最后在使用 pipline 管道操作去重重复数据,感觉会快些,但是我没有测试过,有兴趣的童鞋可以做个测试比较一下。MongoDB 数据情况数据库存在重复数据,如下...
2019-10-31 23:29:06
261
原创 【Python 进阶】先列概要
这篇文章是 Python 进阶系列文章中的一篇,写 Python 也有些时日了,但感觉自己不够 pythonic 而且很多东西都是看过或者写过而已,为了进一步提升 python 的编码能力,打算几篇进阶系列的文章。# 下面是预期写的文章,一篇一篇慢慢更吧!1. 生成器、迭代器、可迭代对象2. Itertools & Collections3. 装饰器4. 元类与魔法方...
2019-10-31 01:05:09
158
原创 Neo4j | Cypher 参考文档
Neo4j | Cypher 参考文档1. Patterns 模式2. Clauses 停用词3. Operators 操作4. Function 函数4.1 Predicate functions4.2 Scalar functions4.3 Aggregating functions4.4 List functions5. Expression 表达规则6. ...
2018-04-24 18:12:00
2510
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人