数据库和SQL
数据库是逻辑上的概念,他们是一对相互关联的数据,
数据组成了表(table)
数据库是表的集合,一个数据中可以放置多张表,我们给每一表命名,表和表之间会有所联系
联系就是数据能够对应匹配,正式名称为联接,对应的操作叫做Join.
ID 唯一的标识符/主键,用来表示数据的唯一性
不会用显示的业务意义,就是一串单纯的数字,每一张表只能有一个主键
使用ID进行联接
数据库中,表的名字和字段应该是英文。如果是主键,只要是id即可,你要关联其他表,则应该以[表名_id]作为联接
联接是关系型数据中的核心概念,是操作的基础
最小化得查询结构为
select column from table
where 是基础查询语法,用于条件判断
and/or 多语句的判断
数据类型的判断的过程中,>=;<=;!=(不等于);
between ...and..
like 模糊查询 %通配符,含义是无论xxx前后是什么内容
WHERE movies LIKE "%XXX%"
group by 数据分析中将数据按组/维度划分。类似于EXCEL中的数据透视表
SELECT *
FROM dataAnalyst
GROUP BY city
使用count 函数,统计计数每个城市拥有的职位数量,括号中的1表示第一列为计数标准
SELECT city,
COUNT(1)
FROM dataanalyst
GROUP BY city
当我们遇到重复数据,在表中,需要去除重复的职位,distinct 去重函数
select city,
count(distinct positionId)
from dataanalyst
group by city
当我们在group by 添加多个字段,它将以多维的形式进行数据聚合
select city,workyear,
count(distinct positionId)
from dataanalyst
group by city, workyear
逻辑判断
SQL 的IF函数
select if(industryField like "%电子商务%",1,0)
FROM dataanalyst