本文是一个Python 使用MongoDB的简单教程,将使用pymongo对MongoDB进行的各种操作进行了简单的汇总,NoSQLFan进行了简单整理,使用Python的同学可以看一看。
下载相应平台的版本,解压即可。为方便使用,将bin路径添加到系统path环境变量里。其中mongod是服务器,mongo是客户shell,然后创建数据文件目录:在c盘下创建data文件夹,里面创建db文件夹。
基本使用:
安装对应语言的Driver,Python 安装 pymongo
$ easy_install pymongo使用方法总结,摘自官方教程
创建连接
>>> import pymongo >>> connection=pymongo.Connection("localhost",27017)切换数据库
>>> db = connection.test_database获取collection
>>> collection = db.test_collectiondb和collection都是延时创建的,在添加Document时才真正创建
文档添加,_id自动创建
>>> import datetime >>> post = {"author": "Mike", ... "text": "My first blog post!", ... "tags": ["mongodb", "python", "pymongo"], ... "date": datetime.datetime.utcnow()} >>> posts = db.posts >>> posts.insert(post) ObjectId("...")批量插入
>>> new_posts = [{"author": "Mike", ... "text": "Another post!", ... "tags": ["bulk", "insert"], ... "date": datetime.datetime(2009, 11, 12, 11, 14)}, ... {"author": "Eliot", ... "title": "MongoDB is online casino fun", ... "text": "and pretty easy too!", ... "date": datetime.datetime(2009, 11, 10, 10, 45)}] >>> posts.insert(new_posts) [ObjectId("..."), ObjectId("...")]获取所有collection(相当于SQL的show tables)
>>> db.collection_names() [u"posts", u"system.indexes"]获取单个文档
>>> posts.find_one() {u"date": datetime.datetime(...), u"text": u"My first blog post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"mongodb", u"python", u"pymongo"]}查询多个文档
>> for post in posts.find(): ... post ... {u"date": datetime.datetime(...), u"text": u"My first blog post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"mongodb", u"python", u"pymongo"]} {u"date": datetime.datetime(2009, 11, 12, 11, 14), u"text": u"Another post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"bulk", u"insert"]} {u"date": datetime.datetime(2009, 11, 10, 10, 45), u"text": u"and pretty easy too!", u"_id": ObjectId("..."), u"author": u"Eliot", u"title": u"MongoDB is fun"}加条件的查询
>>> posts.find_one({"author": "Mike"})高级查询
>>> posts.find({"date": {"$lt": d}}).sort("author")统计数量
>>> posts.count() 3加索引
>>> from pymongo import ASCENDING, DESCENDING >>> posts.create_index([("date", DESCENDING), ("author", ASCENDING)]) u"date_-1_author_1"查看查询语句的性能
>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["cursor"] u"BtreeCursor date_-1_author_1" >>> posts.find({"date": {"$lt": d}}).sort("author").explain()["nscanned"] 2附自己总结的一点小心得,仅供参考
缺点
- 不是全盘取代传统数据库(NoSQLFan:是否能取代需要看应用场景)
- 不支持复杂事务(NoSQLFan:MongoDB只支持对单个文档的原子操作)
- 文档中的整个树,不易搜索,4MB限制?(NoSQLFan:1.8版本已经修改为16M)
特点(NoSQLFan:作者在这里列举的很多只是一些表层的特点):
- 文档型数据库,表结构可以内嵌
- 没有模式,避免空字段开销(Schema Free)
- 分布式支持
- 查询支持正则
- 动态扩展架构
- 32位的版本最多只能存储2.5GB的数据(NoSQLFan:最大文件尺寸为2G,生产环境推荐64位)
名词对应
- 一个数据项叫做 Document(NoSQLFan:对应MySQL中的单条记录)
- 一个文档嵌入另一个文档(comment 嵌入 post)叫做 Embed
- 储存一系列文档的地方叫做 Collections(NoSQLFan:对应MySQL中的表)
- 表间关联,叫做 Reference