我有一张用户访问会话表,其中记录了网站访问者的活动:
访问ID,用户ID,日期,时间,URL
我正在尝试检索用户ID 1234的所有不同会话,以及这些不同会话中每个会话的最早日期和时间.
SELECT
DISTINCT accessid,
date,
time
FROM
accesslog
WHERE userid = '1234'
GROUP BY accessid
这给了我每个不同的访问ID中随机行的日期和时间.我读过许多建议使用min()和max()的文章,所以我尝试了:
SELECT DISTINCT accessid, MIN(DATE) AS date, MIN(TIME) AS time FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC
… 乃至…
SELECT DISTINCT accessid, MIN(CONCAT(DATE, ' ', TIME)) AS datetime FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC
…但是我从来没有得到最早日期和时间的正确结果.
订购这种查询的诀窍是什么?
编辑-
发生了一些奇怪的事情.
Bill Karwin在下面发布的代码正确地检索了2009-09年开始的会话的最早日期和时间.但是,对于从2009-08某天开始的会话,返回的是当月发生的第一次匹配的时间和日期.换句话说,查询似乎没有跨越几个月!
数据集示例:
accessid | userid | date | time
1 | 1234 | 2009-08-15 | 01:01:01
1 | 1234 | 2009-09-01 | 12:01:01
1 | 1234 | 2009-09-15 | 13:01:01
2 | 1234 | 2009-09-01 | 14:01:01
2 | 1234 | 2009-09-15 | 15:01:01
至少在我的实际数据表上,下面发布的查询为两个访问ID的每个查找以下最早的日期和时间:
accessid | userid | date | time
1 | 1234 | 2009-09-01 | 12:01:01
2 | 1234 | 2009-09-01 | 14:01:01
…而且我猜想accessid 2的结果显示正确的唯一原因是因为它在上个月没有命中.
我要疯了吗?
编辑2-
答案是肯定的,我快疯了.当放置在重复结构表中时,查询将对上述示例数据进行处理.
这是(截断的)原始数据.我列出了第一个匹配项,同一个月的另一个匹配项,下个月的第一个匹配项,然后是该月的最后一个匹配项.原始数据集在这些点之间有更多匹配,总计462行.
accessid | date | time
cbb82c08d3103e721a1cf0c3f765a842 | 2009-08-18 | 04:01:42
cbb82c08d3103e721a1cf0c3f765a842 | 2009-08-23 | 23:18:52
cbb82c08d3103e721a1cf0c3f765a842 | 2009-09-17 | 05:12:16
cbb82c08d3103e721a1cf0c3f765a842 | 2009-09-18 | 06:29:59
…查询原始表时,查询将返回2009-09-17值作为最早的值.但是,当我复制……..哦,球.
这是因为2009-08%的匹配中有一个空的userid字段.