上一篇文章使我第一次真正用SQL做分析,在分析的过程中我发现,虽然很多想法能够用SQL语句表达出来,也不再老是受到Excel和编程语言使用习惯不同的烦恼,但是这门看起来简单的语言其实并不简单。作为一个当时学数据库原理考了快90分、搭了一个小数据库的人,我以为我学的还不错,但是真的用到实际分析上,我发现我还是会抓瞎:
脑子:从A表里用子查询查个子集A1,然后连上另一个子查询结果A2再按X分个组查两个字段就好了
手:好。
SQL........sql_mode=only_full_group_by.../8000秒跑不完的SQL/突如其来的 out of memory
啊!!!!!!!!!!土拨鼠咆哮.jpg
这五百万行数据真给我开眼界。
因此,我依然向往着有一天我能靠意念就让SQL给我输出我想要的结果。然鹅在现在还不能实现理想的时候,我还是老老实实复盘一下我上一篇文章遇到的问题和困难吧。
数据类型转换
1)from_unixtime(unixtimestamp,format):把时间戳转换成某个固定格式的字符串类型的日期,主要是换成'年-月-日','时-分-秒'。
UPDATE userbehavior
SET behavior_time=FROM_UNIXTIME(time,'%H:%i:%s');
ALTER TABLE userbehavior
ADD COLUMN dates VARCHAR(255) NOT NULL;
UPDATE userbehavior
SET dates=FROM_UNIXTIME(time,'%Y-%m-%d');
也不难发现,这些format里字母有大写有小写,但是这大小写之间又有什么区别呢?
区别大了!!!我就曾经因为弄混H/h而算错了数,后来发现怎么都不对劲这才发现13点之后没数据..
注意事项:
对于这个函数的运行结果,不要天真地直接通过试图加减一个数字以求取到几天之前的日期,否则你会发现奇怪的结果又增加了:
那用date()改一下类型行不行?
不行。这字符串有自己的想法。
但是不用担心的是,在用DateDiff()的时候不必非对from_unixstamp()的结果多用一个date(),直接用现成的也可以出结果,但如果不放心的话多用一次也没什么。
总结:
- format前后的单引号不要漏,日期单位前的%也不要漏
- 区分好Y/M/D/H的大小写区别
- 不要对直接加减,这样求不出几天前/后的日期。
2)什么关键字后面+table/view/column... +名字,什么关键字后面 +表名
3)使用case when...then...(else..) end 的注意事项:
千省万省不能省END!else可有可无,但end不是。今天的END你爱答不理,改错时END让你叫苦连天。
case不会改变整个数据表的行数,他和group by 不一样,所以如果他作为一个辅助列放在了表里,用聚合函数的时候应该充分考虑是不是需要distinct。
一个case语句里面可以嵌套很多 when...then...(只有一个else):
case(
when con1 then re1
when con2 then re2
...
(else..)
END
)