一、聚合查询:aggregate(*args, **kwargs)
- aggregate()是QuerySet 的一个终止子句,意思是说,它返回一个包含一些键值对的字典。键的名称是聚合值的标识符,值是计算出来的聚合值。
# 计算所有图书的平均价格 from django.db.models import Avg Book.objects.all().aggregate(Avg('price')) # {'price__avg': 34.35} # 键的名称是按照字段和聚合函数的名称自动生成出来的。 # 你也可以为聚合值指定一个名称,并向聚合子句提供它。 Book.objects.aggregate(average_price=Avg('price'))
-
如果你希望生成不止一个聚合,你可以向aggregate()子句中添加另一个参数。所以,如果你也想知道所有图书价格的最大值和最小值,可以这样查询:
from django.db.models import Avg, Max, Min Book.objects.aggregate(Avg('price'), Max('price'), Min('price')) # {'price__avg': 34.35, 'price__max': Decimal('81.20'), 'price__min': Decimal('12.99')}
二、分组查询:annotate()
- 为调用的QuerySet中每一个对象都生成一个独立的统计值(统计方法用聚合函数)。
a、统计每一本书的作者个数
bookList=Book.objects.annotate(authorsNum=Count('authors')) for book_obj in bookList: print(book_obj.title,book_obj.authorsNum)
annotate的返回值是querySet,如果不想遍历对象,可以用上valuelist:
queryResult= Publish.objects.annotate(MinPrice=Min("book__price")).values_list("name","MinPrice") print(queryResult)
三、select_related()
- select_related主要针一对一和多对一关系进行优化。
- select_related使用SQL的JOIN语句进行优化,它会自动查询出与之关联的表里的字段,一起做为查询结果,
- select_related不传任何参数的时候,默认会查询所有的关联对象,且会递归INNER JOIN所有的非空外键!!!
- select_related提供了关键字参数depth,默认为0,即递归直到最后一个对象没有非空外键为止。depth为1时只递归一级外键,以此类推。如果要访问指定深度外的字段,Django会再次进行SQL查询。
- 也接受无参数的调用,Django会尽可能深的递归查询所有的字段。但注意有Django递归的限制和性能的浪费。
- Django >= 1.7,链式调用的select_related相当于使用可变长参数。Django < 1.7,链式调用会导致前边的select_related失效,只保留最后一个
四、prefetch_related()
- 对于多对多字段(ManyToManyField)和一对多字段,可以使用prefetch_related()来进行优化。
- prefetch_related()和select_related()的设计目的很相似,都是为了减少SQL查询的数量,但prefetch_related()的解决方法是通过分别获取各个表的内容,然后用Python处理他们之间的关系来进行优化。
- 可以通过传入None来清空之前的prefetch_related。
五、extra
- 有些情况下,Django的查询语法难以简单的表达复杂的 WHERE 子句,对于这种情况, Django 提供了 extra() QuerySet修改机制 ,它能在 QuerySet生成的SQL从句中注入新子句
- extra可以指定一个或多个 参数,例如 select, where or tables. 这些参数都不是必须的,但是你至少要使用一个!要注意这些额外的方式对不同的数据库引擎可能存在移植性问题.(因为你在显式的书写SQL语句),除非万不得已,否则尽量避免这样做
-
参数之select: select 参数可以让你在 SELECT 从句中添加其他字段信息,它应该是一个字典,存放着属性名到 SQL 从句的映射。
queryResult=models.Article .objects.extra(select={'is_recent': "create_time > '2017-09-05'"})
结果集中每个 Entry 对象都有一个额外的属性is_recent, 它是一个布尔值,表示 Article对象的create_time 是否晚于2017-09-05.
-
参数之where / tables:
您可以使用where定义显式SQL WHERE子句 - 也许执行非显式连接。您可以使用tables手动将表添加到SQL FROM子句。
where和tables都接受字符串列表。所有where参数均为“与”任何其他搜索条件。
举例来讲:
queryResult=models.Article .objects.extra(where=['nid in (1,3) OR title like "py%" ','nid>2'])
-
六、bulk_create()
- 整体插入:
创建对象时,我们看可以通过使用bulk_create()来批量增加记录。例如:
Entry.objects.bulk_create([ Entry(headline="Python 3.0 Released"), Entry(headline="Python 3.1 Planned") ])
七、defer
有时候一个实体有过多的字段,取实体或者实体列表的时候,占用了多大的内存,而你却不需要取出全部的字段,比如博客的正文内容,你不需要立即检索数据库,这时defer就是你需要的东西。defer函数与前面讲的values有区别的,前者返回的是ValuesQuerySet,而defer返回的是QuerySet对象,这意味着,使用了defer后,你还可以结合QuerySet其他的函数,让整个语句结合更多的条件;
八、only
only和defer是同一类的东西,可以理解为defer的相反函数。比如Person实体里有三个字段:name age birthday,下面这两条语句是等价的:
1)Person.objects.defer("age", "biography")
2)Person.objects.only("name")