和使用工具一样,需要先知道你要分析的主题
例如,我有一张旅客住宿信息的表,要分析以下目标
1、频繁住宿人员(3次以上)
2、近7天出入石家庄亚太大酒店的人员
sql脚本编写过程
1、数据样例
select md5(name),md5(id_code),in_time,hotelname from ods_klj_sjb_lg limit 3
数据样例
2、频繁住宿人员(3次以上)(用到count,group by)
select count(*),md5(id_code) from ods_klj_sjb_lg group by md5(id_code) having count(*)>3 order by count(*) desc
部分结果
3、近7天出入石家庄亚太大酒店的人员(concat,to_date,)
select * from (
SELECT
a.*,concat (
substr( in_time, 1, 4 ),
'-',
substr( in_time, 5, 2 ),
'-',
substr( in_time, 7, 2 ),
' ',
substr( in_time, 9, 2 ),
':',
substr( in_time, 11, 2 )
) time_tra
FROM
ods_klj_sjb_lg a) a
WHERE
to_date(time_tra,'yyyy-MM-dd') >= CURRENT_DATE + INTEGER '-7'
and a.hotelname='石家庄亚太大酒店'
以上语法基于postgresql来写的,其他数据库环境脚本大同小异
ps:虽然自已写sql灵活,但是还是建议工具,这样更高效。比如数合建模及可视化