这篇文章其实我很早就想写了,想把自己学习sql时碰到的问题和思考写成文字,对自己做一个总结,但拖延症一直纠缠着我。突然有天晚上我想到我咋都没有点东西能拿出来说说的?我也想对曾今努力过的自己说一声:你很棒!然后痛下决心花了一晚上,写到凌晨2点,写完了,人就是需要被逼一下。
借此机会也感谢一下当时帮我的开发小姐姐,小哥哥们,和优秀的人在一起努力,你会变得更优秀。
以上是废话,现在开始正题~~~
学习内容:sql的数据检索部分,即学会从数据库里取你想要的数据
适合学习对象:对sql感兴趣的人,sql零基础的人,运营,产品….
不适合学习对象:对sql有一定了解的人
如果文中有写的不对的地方,请给位大佬指教~~~
在互联网厂子工作中,经常听到“不要拍脑袋,有数据依据吗”,“数据表现怎样?提升了多少百分点”,“我们要数据驱动”,“要有数据思维”......“数据”2个字好像是每次沟通时必备词。
对于产品运营这类更接近业务的岗位,数据来源大多来自数据平台,而这些平台数据比较局限,可拆分的维度也比较有限,这时候就需要求助于分析师帮忙跑取数据,而你也会收到来自分析师的灵魂拷问:这数据跑了有什么意义吗?或者甩给你一段sql语句,说着你也听不懂的编写方法,让你自己去跑数据。而另一边是领导一次次催促,要求你给出数据结论。此时的你是否恨不得自己马上学会SQL,让跑数据不求人呢?
其实sql是一个可读性非常高的语句,只要你掌握它的结构和一些函数,一般的语句一眼就能看懂。
看到这里,是不是学习的心情蠢蠢欲动?
首先,大致了解一下SQL是个什么东西
SQL是指结构化查询语言(Structured Query Language)。可以创建新的数据库,可以修改现有数据库,可以将数据插入到表中,等等等,但这些对小白来讲基本都用不到,因为你并没有权限,哈哈哈,其实主要这些操作都会影响数据库的数据,所以都是由专门的数据开发管理。而对于技术小白来讲,从数据库里检索数据是最常用的,所以就检索功能而言,SQL就是一段查询语句,你可以用它从数据库表里提取你想要的数据,并能对提取的数据做一些函数计算。(对SQL详细完整的解释请自行百度)
然后,你需要通过建表语简单的了解一下你要提取数据的表的情况
- create table后面一般跟着表名,"daily_call“就是这张表的名字,"ab"指这张表存在叫“ab”的数据库中,后面写sql时会用到
- 括号里第一列的就是该表里所有的字段(如'id'、‘uid')
- 括号里除了第一列剩余的都是表的记录,对每个字段的描述,如bigint,int是指该字段数据的类型是数字的长整型,数字的整型。具体字段类型和他们之间的区别请自行百度,了解即可
最后,你需要了解SQL编写的套路,即结构框架
SELECT column a, column b
FROM table_name
WHERE condition
- column是你要查询的字段名字,比如uid
- table_name是你查询的数据所在表
- condition是你这次查询限制条件,比如只查询2019年1月1号到2109年2月1日的数据
所这段SQL翻译成白话文就是,从某表上查询某数据字段的内容,且满足某些条件。
好了,我们简单试着解读一段SQL
select uid, channelid
from ab.daily_call
where calltype=1
解读一下语句,从ab.daily_call这张表中查询通话类型是音频(calltype=1)的发起方uid。
这个是最基础的“套路”,更进一步的是SQL语句中使用一些列的函数,对字段进行一些计算,毕竟每次提需求的时候,一般不会简单的说“我要有音频通话记录的uid”,会提需求说“我要跑这个月,音频通话成功的用户累计消耗时长”。
select uid, sum(duration) as "累计时长"
from ab.daily_call
where calltype=1
and stats=6
group by uid
- sum()是求和函数,()内是需要求和的字段,注意只有数字能求和,如果字段是文本类型不能求和
- 条件和条件之间用链接运算符“and” ;“or”,“and”表示链接的条件是并列关系,即链接的条件同时满足;“or”表示条件满足其中之一即可
- group by按一个或多个列对结果集进行分组,与集合函数(sum,count,max...)同时出现。说成白话就是算累加,取最大值这种集合函数,需要一个统计的维度,比如是按uid累加还是按日期累加
常用函数:
一、聚合函数
- sum() :求和
- count():计数
- count(distinct ) 去重计数
- max/min():最大值
- avg():平均值
二、时间函数
- from_unixtime(时间戳,日期格式) :将时间戳转变为指定日期格式
- GETDATE( ) :返回当前系统日期
- DATEADD(日期部分,常数,日期) :返回将日期的指定日期部分加常数后的结果返回
三、其他函数
1、case when :条件函数
case 列名
when 条件值1 then 选择项1
when 条件值2 then 选项2.......
else 默认值 end
2、get_json_object(string, '$.string'):解析json格式数据