python 1hour的汇总1

最新推荐文章于 2021-12-26 20:26:47 发布

saomanchum

最新推荐文章于 2021-12-26 20:26:47 发布

阅读量140

点赞数

分类专栏：工作

本文链接：https://blog.csdn.net/qq_39029148/article/details/88996557

版权

工作专栏收录该内容

16 篇文章 0 订阅

订阅专栏

思路：
1、需要汇总的数据有：
在这里插入图片描述
2、考虑需要对多个维度进行groupby
（1）groupby用法：
极客学院
(2)对多个类别进行groupby:

上面SQL的意思是，对Subject_Selection表中的数据进行分组，将具有相同Subject和Semester字段值的记录放到同一个分组里去，然后对每个分组中的数据应用聚合函数（COUNT，SUM， AVG，etc）。
3、两张表的汇总数据合并：UNION

如果select两次，我们可以把两次的搜索结果进行合并，规则：
a. Union必须由两条或者两条以上的SELECT语句组成，语句之间使用Union链接。

b. Union中的每个查询必须包含相同的列、表达式或者聚合函数，他们出现的顺序可以不一致（这里指查询字段相同，表不一定一样）

c. 列的数据类型必须兼容，兼容的含义是必须是数据库可以隐含的转换他们的类型
(1) 不重复合并：Union会帮忙合并重复的数据，返回时直接删除重复的数据
允许重复合并：使用Union All取消自动合并
结果排序
使用Union组合查询时，只能使用一条order by子句对结果集进行排序，而且必须出现在最后一条出现的SELECT语句之后。因为`Union不允许对于部分结果集进行排序，只能针对最终检索出来的结果集进行排序。

注意：由于在多表组合查询时候，可能表字段并不相同。所以，在对于结果集排序的时候需要使用检索出来的共同字段。

(select user_id,user_nickname,user_status from yy_user where user_status = 1)
UNION ALL
(select user_id,user_nickname,user_status from yy_user where user_id > 3)
order by user_id desc
上面检索的字段user_id必须存在于结果集中。

多表组合查询
大型项目中数据经常分布在不同的表，检索的时候需要组合查询出来。多表查询的时候，并不要求两个表完全相同，只需要你检索的字段结构相似就可以。

我们已经有一张user表，假设搜索时候我们需要将用户昵称和博客文章标题一同混合检索。

图片描述

看下上面的posts表，posts_name和user_nickname类型相同，而posts_id和user_id类型相同，post_status和user_status类型相同。尽管他们的名称不相同。

我们可以这么来检索：

select posts_id,posts_name,posts_status from yy_posts
UNION
select user_id,user_nickname,user_status from yy_user
图片描述

从上面的检索结果能看出，我们将两个表的数据组合了起来。Union检索遇到不一致的字段名称时候，会使用第一条SELECT的查询字段名称，或者你使用别名来改变查询字段名称。

区分多表
上一个例子中，我们组合查询了user表和posts表。虽然结果混合在一起没有任何问题，但是当显示到页面的时候，我们需要给用户和文章不同的链接或者其他的区分。所以我们必须确定该条记录来自于哪张表，我们可以添加一个别名来作为表名。

select posts_id,posts_name,posts_status,‘users’ as table_name from yy_posts
UNION
select user_id,user_nickname,user_status,‘posts’ as table_name from yy_user
图片描述

注意SQL语句中的’users’ as table_name。对应的是图片里的table_name，就是我们刚刚添加用于区别表的字段。
以上内容来自：https://segmentfault.com/a/1190000007926959

4、设置时间区间：
获取当前时间:

import datetime

now = datetime.datetime.now()

前一个小时：

# 前一小时
d1 = now - datetime.timedelta(hours=1)

4、对于表一

（1）trans_count:计算在时间段内的总数，存放在trans_count变量中
sql语言：(select count(* ), ‘pgc’ as pgc/ugc
from pgc
WHERE end_time<=now AND d1 <= end_time
GROUPBY imageversion )
UNION ALL
(select count(* ), ‘ugc’ as pgc/ugc
from ugc
WHERE end_time<=now AND d1 <= end_time
GROUPBY imageversion
)

（2）succ_rate: 计算count(suc)/trans_count,存放在succ_rate变量中
sql 语言： (select count(* ), ‘pgc’ as pgc/ugc
from pgc
WHERE end_time<=now AND d1 <= end_time
GROUPBY imageversion )
UNION ALL
(select count(* ), ‘ugc’ as pgc/ugc
from ugc
WHERE end_time<=now AND d1 <= end_time
GROUPBY imageversion
)

saomanchum

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 1hour的汇总1

思路：1、需要汇总的数据有：2、考虑需要对多个维度进行groupby（1）groupby用法：(2)对多个类别进行groupby:上面SQL的意思是，对Subject_Selection表中的数据进行分组，将具有相同Subject和Semester字段值的记录放到同一个分组里去，然后对每个分组中的数据应用聚合函数（COUNT，SUM， AVG，etc）。3、两张表的汇总数据合并...
复制链接

扫一扫

专栏目录