大数据
文章平均质量分 79
liuluTL
这个作者很懒,什么都没留下…
展开
-
数据库三范式
数据库三范式戳这里转载 2020-09-02 15:37:30 · 176 阅读 · 0 评论 -
MySQL索引与事务
文章目录MySQL索引一、什么是索引二、索引优势和劣势三、索引分类和建索引命令语句四、索引结构与检索原理五、哪些情况适合索引六、哪些情况不适合索引MySQL索引一、什么是索引官方定义:索引(index)是帮助MySQL高效获取数据的数据结构。本质:索引是一种数据结构二、索引优势和劣势三、索引分类和建索引命令语句四、索引结构与检索原理五、哪些情况适合索引六、哪些情况不适合索引...原创 2020-04-06 22:05:08 · 148 阅读 · 0 评论 -
关系型数据库中主键(primary key)和外键(foreign key)的概念。
刚接触关系型数据库的同学,会听过主键和外键的概念。这是关系型数据库的基本概念,需要清楚理解。今天我就以简洁的语言总结一下这个概念。主键。一句话概括:一张表中,可以用于唯一标识一条记录的字段组(或者说是属性组)。给你一个主键的值,你就可以找到一条确定的记录。如:学生表:学号,姓名,性别,课程。这里学号就是主键。给你一个学号,就可以找到一条学生记录。课程表:课程编号,课程名称,学分。这里课程编号就...转载 2020-04-06 17:23:56 · 2161 阅读 · 0 评论 -
HiveSQL基础
文章目录HiveSQL一、HiveSQL与传统SQL的区别二、MapReduce的工作流程基础语法一、基础select(与SQL一样)+分区二、group by三、order by四、执行顺序常用函数一、如何把时间戳zhuanHiveSQL一、HiveSQL与传统SQL的区别存储位置上:hivesql存储在hdfs上,传统SQL存储在块设备或者本地文件中数据格式:hiveSQL的数据格式...原创 2020-04-01 15:50:45 · 891 阅读 · 0 评论 -
34道经典SQL试题(完结附create原数据)
文章目录MySQL练习题数据表代码第一题:取得每个部门最高薪水的人员名称MySQL练习题数据表代码drop table if exists dept;drop table if exists salgrade;drop table if exists emp; create table dept( deptno int(10) primary key, dname varch...原创 2020-03-28 23:12:42 · 2313 阅读 · 0 评论 -
数据库练习——leetcode(196):删除重复的邮箱(delete not in)
文章目录删除重复的邮箱一、题目二、解析删除重复的邮箱一、题目二、解析可以先找到独特的ID,然后从原表中将不在独特ID中的数据删除注意要将独特的ID生成一个临时表,否则会报错因为对于SQL里删除这个操作而言 要求查询条件里不能有删除的那个表 就是删除Person表时person表不能出现在where条件里 防止出现递归删除或死循环 所以需要在外面套一层临时表t解决这个问题dele...原创 2020-03-26 11:51:34 · 254 阅读 · 0 评论 -
数据库练习——leetcode(185):部门工资前三高的员工(骚操作,选取每个部门前三名的工资)
文章目录部门工资前三高的员工题目解析部门工资前三高的员工题目解析第一步:找到每部门前三名的工资,注意可以有的部门前三名的工资人数不足三个,当然也有可能多于3,该怎么解决,当时我看答案清一色的3>count,我也是一脸蒙蔽,看了多家的解析才看懂,对于我这种小白也是一大挑战了。select e1.Salary from Employee as e1 where 3 > (se...原创 2020-03-23 22:15:29 · 434 阅读 · 0 评论 -
数据库练习——leetcode(184):部门工资最高的员工(in的骚操作:两个字段竟然也可以用in)
文章目录部门工资最高的员工题目解析部门工资最高的员工题目解析第一步:在emploee表中找到最大的工资以及部门ID,这样做的好处是可以避免有多个人工资都最高第二步:内连接后,查找题上给定的字段,条件是工资与ID在第一步查找的表中第一步SELECT DepartmentId, MAX(Salary)FROM EmployeeGROUP BY Departmen...原创 2020-03-23 21:10:27 · 223 阅读 · 0 评论 -
数据库练习——leetcode(183):从不订购的客户(左连接)
文章目录从不订购的客户题目解析从不订购的客户题目解析select c.Name as Customers from Customers as c left join Orders as o on c.ID = o.CustomerID where o.CustomerID is null;左连接时候,左边的显示完整表,右边的不满足on后面的条件则为null,注意判断不存在的值时用...原创 2020-03-22 10:44:24 · 180 阅读 · 0 评论 -
数据库练习——leetcode(182):查找所有重复的电子邮箱(如何查找一个字段中重复的数字group by 与having)
文章目录查找所有重复的电子邮箱(如何查找一个字段中重复的数字)题目解析思路一:子查询思路二:group by 和 having查找所有重复的电子邮箱(如何查找一个字段中重复的数字)题目解析思路一:子查询先利用group by按相同的email分成一个组,做聚合统计,将每个email的数量计算出来,形成一个表,再在这个表里查询count(email)大于2的数量:select Emai...原创 2020-03-22 10:17:14 · 540 阅读 · 0 评论 -
数据库练习——leetcode(181):超过经理收入的员工
文章目录超过经理收入的员工题目解析超过经理收入的员工题目解析笛卡尔积查询,添加两个条件select a.Name as Employee from Employee as a join Employee as b on a.ManagerId = b.Id and a.Salary>b.Salary...原创 2020-03-22 09:40:03 · 269 阅读 · 0 评论 -
数据库练习——leetcode(180):连续出现的数字
文章目录连续出现的数字题目解析连续出现的数字题目解析首先一定要非常明确的是本题是要找连续出现的数字,连续!如何判断连续,通过ID来判断,步骤一:将表复制三份,分别命名为l1,l2,l3select * from Logs as l1, Logs as l2, logs as l3这个的效果为两个表相连接了,笛卡尔连接,一个ID对应另一个表的全部ID,效果如下:步骤二:找到...原创 2020-03-21 23:32:34 · 251 阅读 · 0 评论 -
虚拟机下利用ubuntu系统在本地搭建三节点Hadoop集群的全过程(附全部环境信息)
目录背景简述搭建流程1.虚拟机环境搭建及相关文件的...转载 2020-03-21 08:07:13 · 1511 阅读 · 0 评论 -
Hive基础
文章目录Hive基础一、hive是什么?——数据仓库二、hive与mysql的区别三、Hive的优势四、Hive的数据类型基本数据类型复杂数据类型五、Hive数据定义与操作(重点)数据库相关操作1 创建数据库2 查看数据库信息3 删除数据库4 修改数据库数据表相关1 创建数据表2 查看数据表结构3 内部表与外部表的区别4 修改表5 删除表6 清空表7 分区表8 数据的导入与导出Hive基础首...原创 2020-04-01 10:01:59 · 262 阅读 · 0 评论 -
数据库练习——leetcode(178):分数排名
文章目录数据库练习——leetcode(178):分数排名一、题目二、解析数据库练习——leetcode(178):分数排名一、题目二、解析首先我们看到输出结果有两列,因此我们要查询的是两个东西,一个是分数,一个是排名。分数好茶,普通查询加一个排序即可,那我们应该如何计算排名?你给一个分数,要计算这个分数排第几名只需要知道你前面有多少个distinct分数比你高的即可,然后再count一...原创 2020-03-19 10:16:28 · 370 阅读 · 0 评论 -
数据库练习——leetcode(177):第N高的薪水
文章目录第N高的薪水一、题目二、解析第N高的薪水一、题目二、解析参考第176题,求解第二高的薪水,只不过此题需要考虑N=0的情况,N=0时,同样返回NULLCREATE FUNCTION getNthHighestSalary(N INT) RETURNS INTBEGIN SET N = N-1; IF N < 0 THEN RETURN NULL; ELSE...原创 2020-03-19 09:16:36 · 335 阅读 · 0 评论 -
数据库练习——leetcode(176):薪资第二的薪水-分页查询limit与对null的处理
文章目录数据库练习——leetcode(176):分页查询limit与对null的处理题目二、解析数据库练习——leetcode(176):分页查询limit与对null的处理题目二、解析利用limit语句进行查询:select distinct Salary as SecondHighestSalaryfrom employeeorder by Salary descli...原创 2020-03-18 16:32:44 · 167 阅读 · 0 评论 -
MySQL函数:LIMIT与OFFSET,IFNULL
文章目录MySQL函数一、LIMIT 与OFFSET二、IFNULL函数MySQL函数一、LIMIT 与OFFSET之前只知道limit(分页查询)的用法,没想到竟然又冒出来一个OFFSET:limit start, countstart 默认值为0,表示跳过多少数据开始查询count表示跳过start条数据后,要查询count条数据limit a offset b他代表的...原创 2020-03-18 16:14:54 · 403 阅读 · 0 评论 -
数据库练习——leetcode(175):多表查询
文章目录数据库练习——leetcode(175):组合两张表 外连接一、题目二、解析三、内连接与外连接数据库练习——leetcode(175):组合两张表 外连接一、题目二、解析本题主要考察多表连接。按题意要求,使用outer join时可以保证指定表的每条记录都出现----即使没有匹配, outer join又可以分为left join, right join, full joi...原创 2020-03-18 13:01:43 · 253 阅读 · 0 评论 -
MySQL(二):数据库设计
文章目录数据库设计一、三范式第一范式(1NF):强调列的原子性,即列不能再分成其他列第二范式(2NF):首先是1NF,另外包含两个部分的内容,一是必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。第三范式(3NF):首先是2NF;另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在列A依赖于非主键列B,非主键列B依赖于主键的情况。二、E-R模型三、逻辑...原创 2020-03-18 11:21:55 · 177 阅读 · 0 评论 -
windows虚拟机中配置Hadoop Hive(二)
文章目录windows虚拟机中配置Hadoop Hive(二)一 利用Xftp将软件包上传到Linux中二 配制免密登录三 解压软件包到/opt/module四 编辑环境变量:五 重新加载该文件 使环境变量生效六 修改hadoop的配置文件:windows虚拟机中配置Hadoop Hive(二)完全分布式:Hadoop守护进程运行在一个集群上伪分布式:在单节点集群上运行Hadoop,其中所有...原创 2020-03-18 08:55:46 · 1349 阅读 · 0 评论 -
windows虚拟机中配置Hadoop Hive(一)
文章目录windows搭建Hadoop集群一 安装VMware二 配置网络三 创建虚拟机四 利用xshell连接虚拟机五 关闭防火墙六 关机:poweroff(只能用root用户来关机)windows搭建Hadoop集群所用的是centos7一 安装VMware二 配置网络配置主机网络: 控制面板 网络和Internet 更改适配器设置 网络连接:设置如下图所示:双击协议版本4...原创 2020-03-18 08:53:58 · 528 阅读 · 0 评论 -
Hadoop简介
文章目录Hadoop简介一 HadoopHDFSMapReduce 分布式计算框架Yarn 分布式资源管理器Hadoop的shell操作启动 关闭Hadoop集群查看HDFS上的文件目录在HDFS上创建文件夹上传文件下载文件删除文件查看文件内容查看集群的资源占用情况Hadoop简介一 Hadoop当我们说起Hadoop 的时候,不仅仅是说他自己,还有好多个东西:Hadoop组成最底层H...原创 2020-03-18 08:41:20 · 233 阅读 · 0 评论 -
MySQL(一)增删改查
文章目录MySQL简单命令数据表的操作创建表数据增删改查(curd)1 增加insert 的三种方式1.2 指定列插入,值和列一一对应1.3 多行插入2 修改 update3 删除 delete4 查询4.1 新建数据库4.2 添加数据4.3 基础查询4.4 条件查询where4.4.1 比较运算符4.4.2 逻辑运算符 与(and)或(or)非(not)4.5 模糊查询(like)4.6 范围查...原创 2020-03-18 08:59:20 · 141 阅读 · 0 评论