MongoEngine 查询数据库

最新推荐文章于 2023-10-08 17:19:17 发布

qq_30595231

最新推荐文章于 2023-10-08 17:19:17 发布

阅读量5.6k

点赞数 4

分类专栏： python 文章标签：数据

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Document类有一个objects 属性，用来访问在数据库中跟这个类有关的数据。这个objects 属性其实是一个QuerySetManager ，它会创建和返回访问的一个新的 QuerySet。这个QuerySet 可以是在数据库中取出的重复的Document：

查询过滤
可以通过使用 QuerySet 对象的关键字参数来对数据查询进行过滤，关键字查询中的键只想你想要查询的document：

uk_users = User.objects(country='uk')  
#对于内嵌document的字段可以使用双下划线的的语法来进行访问：

查询操作符
在查询中也可以使用操作符，只要将其加在关键子的双下划线之后即可：

#可用的操作符如下：
young_users = Users.objects(age__lte=18)  
ne – 不等于
lt – 小于
lte – 小于等于
gt – 大于
gte – 大于等于
not – 使其检查的反面，需要使用在其他操作符之前(e.g. Q(age__not__mod=5))
in – 值在list里面
nin – 值不在list里面
mod – value % x == y
all – list里面所有的值
size – 这个array的大小
exists – 存在这个值
#一下操作符在需要进行正则检查的时候是比较快捷的方法：


exact – 字符串型字段完全匹配这个值
iexact – 字符串型字段完全匹配这个值（大小写敏感）
contains – 字符串字段包含这个值
icontains –字符串字段包含这个值（大小写敏感）
startswith – 字符串字段由这个值开头
istartswith –字符串字段由这个值开头（大小写敏感）
endswith – 字符串字段由这个值结尾
iendswith –字符串字段由这个值结尾（大小写敏感）
match – 使你可以使用一整个document与数组进行匹配查询list
#对于大多数字段，这种语法会查询出那些字段与给出的值相匹配的document，但是当一个字段引用 ListField 的时候，而只会提供一条数据，那么包含这条数据的就会被匹配上：

class Page(Document):  
    tags = ListField(StringField())  

# This will match all pages that have the word 'coding' as an item in the  
# 'tags' list  
Page.objects(tags='coding')

#可以通过list的位置来进行查询，你可以使用一个数字来作为查询操作符，例子如下
 Page.objects(tags__0='db')

#如果你只是想取出list中的一部分，例子如下：
 # comments - skip 5, limit 10  
 Page.objects.fields(slice__comments=[5, 10])

#更新document的时候，如果你不知道在list中的位置，你可以使用 $ 这个位置操作符
Post.objects(comments__by="joe").update(**{'inc__comments__$__votes': 1})

#可是，如果这种映射不能正常工作的时候可以使用大写 S 来代替：
Post.objects(comments__by="joe").update(inc__comments__S__votes=1)

error：.. note:: Due to Mongo currently the $ operator only applies to the first matched item in the query.

原始查询
你可以使用一个原始的 pymongo 语句来进行查询，这样可以进行原始的完整查询，使用raw 参数：

Page.objects(__raw__={'tags': 'coding'})

限制和跳过结果
就像传统的ORM一样，你有时候需要限制返回的结果的数量，或者需要跳过一定数量的结果。QuerySet里面可以使用 limit()和skip()这两个方法来实现，但是更推荐使用数组切割的语法：

users = User.objects[:5]
users = User.objects[10:15]  
#你可以指定让查询返回一个结果。如果这个条在数据库中不存在，那么会引发IndexError 。使用first() 方法在数据不存在的时候会返回None：
User.drop_collection()
User.objects[0]
User.objects.first() == None 
#True
User(name='Test User').save()
User.objects[0] == User.objects.first()

查询唯一的结果
在collection中查询唯一的结果，使用get()方法。如果没有结果匹配会引发 DoesNotExist。如果有多个结果返回的话会引发MultipleObjectsReturned。
有一个变种的方法，get_or_create() 它会新建一个document如果没有结果匹配。里面的参数会作为这个document的默认值：

a, created = User.objects.get_or_create(name='User A', defaults={'age': 30})
b, created = User.objects.get_or_create(name='User A', defaults={'age': 40})
a.name == b.name and a.age == b.age

默认Document查询
默认情况下，objects属性会将collection的所有结果返回为一个 QuerySet 对象，并且没有进行过滤。这一点可以通过给document定义一个方法来修改QuerySet 。这个方法需要两参数— doc_cls 和 queryset 。第一个参数是定义这个方法的 Document 类名，第二个参数是初始化的 QuerySet。这个方法需要使用 queryset_manager()来装饰来使它被认可。

class BlogPost(Document):  
    title = StringField()  
    date = DateTimeField()  

    @queryset_manager  
    def objects(doc_cls, queryset):  
        # This may actually also be done by defining a default ordering for  
        # the document, but this illustrates the use of manager methods  
        return queryset.order_by('-date') 
#你不用调用objects 方法，你可以定义定制的管理方法
class BlogPost(Document):  
    title = StringField()  
    published = BooleanField()  

    @queryset_manager  
    def live_posts(doc_cls, queryset):  
        return queryset.filter(published=True)  

BlogPost(title='test1', published=False).save()  
BlogPost(title='test2', published=True).save()  
assert len(BlogPost.objects) == 2  
assert len(BlogPost.live_posts()) == 1

定制QuerySet

当你想自己定义一些方法来过滤document的时候，继承 QuerySet类对你来说就是个好的方法。在document里面使用一个自定义的QuerySet类，在document里的meta字典里设置queryset_class的值就可以实现了。

class AwesomerQuerySet(QuerySet):  

    def get_awesome(self):  
        return self.filter(awesome=True)  

class Page(Document):  
    meta = {'queryset_class': AwesomerQuerySet}  

# To call:  
Page.objects.get_awesome()

给结果集计数
就像限制和跳过结果一样，QuerySet对象提供了用来计数的方法–count()，不过还有一个更加符合python的方法来实现：

num_users = len(User.objects)

更多功能的计数
当你想为document的特定的字段的数量计数的时候，可以使用sum()：

yearly_expense = Employee.objects.sum('salary')

当你为某个字段求平均值的时候，可以使用average():

mean_age = User.objects.average('age')

mongoengine提供了一个方法来获取一个在集合里item的频率，item_frequencies()，下面是一个例子：

class Article(Document):  
    tag = ListField(StringField())  

# After adding some tagged articles...  
tag_freqs = Article.objects.item_frequencies('tag', normalize=True)  

from operator import itemgetter  
top_tags = sorted(tag_freqs.items(), key=itemgetter(1), reverse=True)[:10]

检索字段的子集
有时候你只想检索一条document的某些字段，可以使用only()，把需要检索的字段作为参数，没有选中的字段则会返回默认值：

class Film(Document):
      title = StringField()
      year = IntField()
      rating = IntField(default=3)
Film(title='The Shawshank Redemption', year=1994, rating=5).save()
f = Film.objects.only('title').first()
f.title
#'The Shawshank Redemption'  
f.year   # None
f.rating # default value

高级查询
有时候使用关键字参数返回的QuerySet不能完全满足你的查询需要。例如有时候你需要将约束条件进行与，或的操作。你可以使用mongoengine提供的 Q 类来实现，一个 Q 类代表了一个查询的一部分，里面的参数设置与你查询document的时候相同。建立一个复杂查询的时候，你需要用 & 或 | 操作符将 Q 对象连结起来，例子如下：

Post.objects(Q(published=True) | Q(publish_date__lte=datetime.now()))

Post.objects((Q(featured=True) & Q(hits__gte=1000)) | Q(hits__gte=5000))

自动更新
你而已对一个QuerySet()使用update_one()或update()来实现自动更新，有一些可以与这两个方法结合使用的操作符

set – 设置成一个指定的值强调内容
unset – 删除一个指定的值
inc – 将值加上一个给定的数
dec – 将值减去一个给定的数
pop – 将 list 里面的最后一项移除
push – 在 list 里面添加一个值
push_all – 在 list 里面添加好几个值
pull – 将一个值从 list 里面移除
pull_all – 将好几个值从 list 里面移除
add_to_set – 如果list里面没有这个值，则添加这个值自动更新的语法与查询的语法基本相同，区别在于操作符写在字段之前：*

post = BlogPost(title='Test', page_views=0, tags=['database'])
post.save()
BlogPost.objects(id=post.id).update_one(inc__page_views=1)
post.reload()  # the document has been changed, so we need to reload it
post.page_views   #1

BlogPost.objects(id=post.id).update_one(set__title='Example Post')
post.reload()
post.title
#'Example Post'  
BlogPost.objects(id=post.id).update_one(push__tags='nosql')
post.reload()
post.tags
['database', 'nosql']