SQL应用于简单的数据分析工作

从事数据分析工作基本上离不开SQL的使用,如果不知道如何写SQL,很多数据清洗,包括分析都会困难。

一、SQL语言在数据分析行业的学习知识框架

​在计算机行业,工程师基本的业务也就是对数据的增删查改,在数据分析行业也不例外。数据分析行业,导入数据,清洗数据,用SQL是可以完现的,但是如果是要用SQL来直接做数据分析,请忽略这个笑话。

我们知道了SQL数据库主要就是存储数据,清理数据两大功能之后,仔细思考,我们只要能够在现有的表格里面查询出数据,能够更新数据对数据进行重编码,知道怎么增加添加数据,把数据变得规整就行。导入导出数据可以使用工具,分析数据可以使用ODBC或者其他的接口对数据库进行连接,更多高级的功能,主键,索引,等等,对于一个需要尽快入门SQL的数据分析人员来说,我觉得根本不需要吧。还有数据的排序、数据的交集并集、拼接。把数据转换出花样这些,估计也都是进阶以后才需要的。

所以下面就简单的给一些案例语句叙述一下这个过程吧:

二、学会select学会添加字段和找出需要的数据

select  cola, colb, colc  into newtable  from oldtable  where cola='x' and colb is not null;

这个模板基本上就可以完全的查出大部分的数据了。select后面是一个个的字段,要哪个选哪个。有into意味着将查到的数据插入到一张新表里面,没有就是只查询出来。where后面是条件,等于某个值,或者是不是空值,是最常用的几种查询方式。

还有一种select也用的非常多:

select cola from oldtable group by cola;

这个语句是看看cola有多少种值的可能性。

select进阶学习,可能要讲讲join,union,以及多个查询组合成的嵌套查询,或者是子查询的模式,以及模糊查询。这个对于需要急于上手的人来说,暂时是不需要的。如果有需要我会在未来再花篇幅在写出来给大家参考。

三、​​学会alter学会增加,减少字段

alter可以做的事情很多,增加字段,减少字段。

1.增加字段

alter table tablename add colname varchar;

这样就可以增加​一个空字段,varchar是一种数据类型。

2.减少字段

alter table tablename drop column colname;

这样就去掉了一个原有的字段。

四、学会update学会更新数据

更新数据大概常用的有两种,一种是更新成一个固定值:

update table set col=1;

另一种是从另一张表里面更新,这种方法,在处理一些小型数据的时候经常会导出,然后导入到数据库,就可以用:

update table set col=tableb.col from tablebwhere table.id=tableb.id;

里面table和tableb是两张表,然后通过两张表的id关联起来。学会了这个书写结构就行。

五、用insert插入记录

请记住,这个命令只能插入行:

insert into table( cola,colb) values (1,2);

insert into table (cola,colb) select a,b fromtableb;

两种不同的insert方法,一个是自己录入数据时使用,一个是从另一张表里面导出数据时使用。

没有更多推荐了,返回首页