前言
无意在交流群里看到一个问题,Django中如何对数据分组后查取每组的最新数据,最近一直在使用Django,试着解决了一下这个问题。
下面就模拟下场景,有两张表,一张作者表,一张文章表,需求查出每个作者最新发表的文章。
一、建立测试数据库添加数据
作者表
文章表
二、查询
代码如下:
from django.db.models import OuterRef, Subquery
from learning_logs.models import Article, Author
from django.db.models import F
article = Article.objects.filter(author_id=OuterRef('author_id')).order_by('-create_time').values_list('id')
article = Article.objects.filter(id__in=Subquery(article[:1]))
主要就是运用子查询,先查出来每个作者的最新文章ID,然后在进行一次筛选。但如此会报错,django.db.utils.NotSupportedError: (1235, "This version of MySQL doesn't yet support 'LIMIT & IN/ALL/ANY/SOME subquery'")
提示当前版本的数据库不支持此操作,不知道别的版本的数据库行不行,这里没有继续进行尝试了,而是换了种方法。
from django.db.models import OuterRef, Subquery
from learning_logs.models import Article, Author
from django.db.models import F
article = Article.objects.filter(author_id=OuterRef('author_id')).order_by('-create_time').values_list('id')
article = Article.objects.annotate(tag=Subquery(article[:1]))
article = article.filter(id=F("tag"))
这里用注解函数把最新文章的ID注解到tag字段,然后在筛选出ID等于tag,如此便可以查出想要的结果。
总结
以上方法就是相当于SQL语句中的自联结过滤,除开不在代码中进行遍历的方法,不知道还有没有别的好的方法,欢迎大家来指点讨论下。