自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 《数据结构与算法》整理-图

整理张铭老师《数据结构与算法》笔记7. 图7.1 图的概念和抽象数据类型7.1.1 图的定义和术语1.G=(V,E) 表示V是顶点集合E是边集合2.完全图3.稀疏图稀疏度(稀疏因子)边条数小于完全图的5%4.密集图5.无向图边涉及顶点的偶对无序实际上是双通6.有向图边涉及顶点的偶对是有序的7.标号图8.带权图9.顶点的度与顶点相关联边的数目,入度 出度1...

2020-03-15 09:51:28 454

原创 《数据结构与算法》整理-树

整理张铭老师《数据结构与算法》笔记6. 树6.1 树的定义和基本术语树是包括n个结点的有限集合T(n>=1)度数:一个结点的子树的个数层数:根为第0层深度:层数最大的叶结点的层数高度:层数最大的叶结点的层数加16.1.1 森林转化为二叉树在森林中的所有兄弟结点之间加一连线对每个结点。去掉除了与第一个孩子之外的其他所有连线6.1.2 二叉树转换为森林若结点x是其双...

2020-03-03 05:33:18 1303

原创 《数据结构与算法》整理-二叉树

整理张铭老师《数据结构与算法》笔记5.二叉树5.1 二叉树概念结点的有限集合 ,空集或一个根结点及两颗互不相交的左右子树的二叉树组成的结合满二叉树、完全二叉树、扩充二叉树5.2 二叉树的抽象数据类型遍历二叉树5.2.1 深度优先遍历二叉树1)前序法2)中序法3)后序法深度优先遍历二叉树(递归)template<class T>void BinaryTree&l...

2020-03-01 10:11:16 279

原创 《数据结构与算法》整理-字符串

整理张铭老师《数据结构与算法》笔记字符串的模式匹配用给定的模式P,在目标字符串T中搜索与模式P全同的一个子串,并求出T中第一个与P全同匹配的子串,返回其首字符位置朴素模式匹配(穷举法)设T=t0,t1,t2,…,tn,P=p0,p1,p2,…,pm-1i为T中字符的下标,j为P中字符的下标匹配成功即为,T.substr(i,m)==P.substr(0,m)匹配失败(pj≠ti)时...

2020-02-14 21:42:56 546

原创 HTTP —— 学习笔记

HTTP概述HTTP报文URL与资源Web服务器代理缓存连接管理

2019-06-14 10:50:46 135

原创 常用相关查询sql语句——时间、排序

相关查询sql语句——时间、排序时间时间戳与日期格式的相互转换UNIX时间戳转换成日期:FROM_UNIXTIME()select FROM_UNIXTIME(1493138520)输出为:2017-04-26 00:42:00日期转换为UNIX时间戳:UNIX_TIMESTAMP()select UNIX_TIMESTAMP('2017-04-26 00:42:00','...

2019-06-02 18:58:48 9029

原创 python学习——python编程从入门到实践(8)

第 8 章 函数# 8-1def display_message(msg): print("Hello,"+msg.title()+"!")display_message('jessi')# 8-2def favorite_book(title): print("One of my favorite books is: "+title.title())favorit...

2019-02-27 18:57:24 199

原创 python学习——python编程从入门到实践(7)

第 7 章 用户输入和while循环课后题# 7-1message = input("What kind car do you need? ")print("Let me see if I can find you a "+message)#7-2message = input("How many people have the dinner? ")message = int(m...

2019-02-20 21:33:05 190

原创 python学习——python编程从入门到实践(6)

第 6 章 字典课后题#6-1user = { 'first_name':'marle', 'last_name':'curle', 'age':25, 'city':'Beijing',}print(user)#6-2favorite_numbers = { 'jen':2, 'sarah':5, 'edward':7,...

2019-02-19 23:14:00 184

原创 python学习——python编程从入门到实践(5)

第5章 if 语句课后题#5-1car='subaru'print("Is car=='subaru'?I predict TRUE")print (car == 'subaru')print("\nIs car == 'audi'?I predict False")print(car=='audi')#5-2str1='Sunday'str2='sunday'print...

2019-02-19 22:45:10 171

原创 python学习——python编程从入门到实践(4)

第4章 操作列表【动手试一试】练习题#4-3 数到20for number in range(1,21): print(number)#4-5 计算 1~1000000 的总和numbers = list(range(1,1000000))print(sum(numbers))#4-7 3的倍数numbers = list(range(3,31,3))print(numb...

2019-02-10 20:16:31 180

原创 python学习——python编程从入门到实践(3)

第3章 列表【动手试一试 】练习题:列表元素访问:# 3-1names = ['David','Alice','Carolina']print('Welcome, '+ names[0] +'.')print('Welcome, '+ names[1] +'.')print('Welcome, '+ names[2] +'.')列表元素修改、插入、删除:# 3-4visit...

2019-02-09 22:37:08 177

原创 python学习——python编程从入门到实践(2)

第 2 章 变量和数据类型

2019-02-09 16:12:47 132

原创 Hive学习—调优&其他文件格式和压缩方法&开发&函数

第10章 调优HiveQL是一种声明式语言,用户会提交声明式的查询,而Hive会将其转换成MapReduce job。**10.1 使用EXPLAN **10.2 EXPLAN EXTENDED10.3 限制调整10.4 JOIN优化将最大的表放置在JOIN语句的最右边。如果所有表中有一个表足够小,是可以完成载入到内存中,那么Hive可以执行一个map-side JOIN,这样可以减...

2019-02-06 21:21:21 318 1

原创 Hive学习—HiveQL:视图 & 索引 & 模式设计

第7章 HiveQL:视图** 7.1 使用视图来降低查询复杂度**** 7.2 使用视图来限制基于条件过滤的数据**** 7.3 动态分区中的视图和map类型**第8章 HiveQL:索引第9章 模式设计** 9.1 按天划分的表**** 9.2 关于分区**HDFS用于设计数百万的大文件,而非数十亿的小文件。使用过多的分区可能导致的问题是会创建大量的非必须的Hadoop文件和文...

2019-02-05 22:45:43 182

原创 Hive学习—hive函数学习

hive函数学习一、关系运算:=、&lt;&gt;、&lt;、&gt;、&lt;=、&gt;=、IS NULL、IS NOT NULL、LIKE、RLIKE、REGEXP其中:RLIKE语法: A RLIKE B操作类型: strings描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合JAVA正则表达式B的正则语法,则为TRUE;否则为FALSE。举例:...

2019-02-05 15:57:50 285

原创 Hive学习—HiveQL:查询

第6章 HiveQL:查询6.1 SELECT…FROM语句选择的列是集合数据类型时,Hive会使用Json语法应用于输出。--数组类型hive-&amp;amp;amp;gt;SELECT name,subordinates FROM employees;John Doe {&amp;amp;quot;Mary Smith&amp;amp;quot;,&amp;amp;quot;Todd Jones&amp;amp;quot;}--MAP类

2019-02-05 11:08:50 1034

原创 Hive学习—数据操作

第5章 HiveQL:数据操作第4章主要介绍如何创建表,随之而来的下个问题即,如何装载数据到这些表中。本章主要讨论Hive查询语言中,向表中装载数据和从表中抽取数据到文件系统的数据操作语言部分。5.1 向管理表中装载数据既然H没有行级别的数据插入、数据更新和删除操作,那么往表中装载数据的唯一途径就是使用一种“大量”的数据装载操作。LOAD DATA LOCAL…拷贝本地数据到位于分布式文...

2019-01-27 10:52:34 191

原创 Hive学习—HiveQL:数据定义

第4章 HiveQL:数据定义HiveQL可能和MySQL语句接近,但是两者还是存在显著差异。Hive不支持行级插入操作、更新操作和删除操作。Hive也不支持事务。4.1 Hive 中的数据库--创建数据库CREATE DATABASE financials--查看Hive中包含的数据库SHOW DATABASES--使用正则匹配筛选出需要的数据库SHOW DATABASES LI...

2019-01-27 00:39:02 239

原创 Hive学习—数据类型和文件格式

第3章 数据类型和文件格式Hive 所支持的基本数据类型。基本数据类型数据类型长度例子TINYINT1byte20SMALINT2byte20INT4byte20BIGINT8byte20BOOLEANtrue 或者 falseTRUEFLOAT单精度浮点数3.14159DOUBLE双精度浮点数3.141...

2019-01-26 22:03:44 163

原创 Hive学习-基础知识

第1章 基础知识1.1 Hadoop 和 MapReduce 综述MapReduce 来自于两个基本的数据转换操作:map过程和reduce过程。一个map操作会将集合中的元素从行索引的形式转换成kv对。输入的键是行索引,输出的键是字段名。在MapReduce计算框架中,某个键的所有键-值对都会分发到同一个reduce操作中。也就是这个键和这个键所对应的所有值都会传递给同一个Reducer。...

2019-01-25 18:38:48 132

原创 SQL学习—优化SQL查询性能

1-11 让SQL飞起来使用高效的查询参数是子查询时,使用EXISTS代替IN。两个代码对比:--慢SELECT *FROM Class_AWHERE id IN (SELECT id FROM Class_B)--快SELECT *FROM Class_AWHER...

2019-01-23 18:04:09 170 1

原创 SQL学习—HAVING子句又回来了

1-10 HAVING子句又回来了本节 主要学习HAVING子句的应用技巧,“调查集合自身性质”应用场景:查找可以出勤的队伍。即队伍里所有队员都处于“待命”状态。(1)使用NOT EXISTS 表达式/* 用谓词表达全称量化命题 */SELECT team_id, member FROM Teams T1 WHERE NOT EXISTS (SELECT * ...

2019-01-20 23:24:58 260

原创 SQL学习—用SQL处理数列

1-9 用SQL处理数列生成连续编号通过对两个Digits集合求笛卡尔儿积而得出0~99的数字。-- 求连续编号(1):求0~99 的数SELECT D1.digit + (D2.digit * 10) AS seqFROM Digits D1 CROSS JOIN Digits D2ORDER BY seq求全部的缺失编号/* 动态地指...

2019-01-20 14:31:41 515

原创 SQL学习—EXISTS谓词的用法

1-8 EXISTS谓词的用法SQL中的谓词逻辑SQL的基础理论:集合论谓词逻辑理论篇谓词:如&amp;quot;=、&amp;amp;lt;、&amp;amp;gt;、BETWEEN、LIKE、IN、IS NULL&amp;quot;等。谓词逻辑提供谓词为了判断命题的真假。在关系数据库里,表中的一行可以看作是一个命题。表常常被认为是行的集合,但从谓词逻辑的观点看,可以认为是命题的集合。数据库这种叫法有点名不副实,它存储的与其说是数据,还不如说...

2019-01-16 17:20:47 511

原创 SQL—用SQL进行集合运算

1-7 用SQL进行集合运算注意事项01 SQL能操作具有重复行的集合,可以通过ALL支持。SQL的集合运算提供了允许重复和不允许重复的两种用法。如果直接使用UNION或INTERSECT,结果里就不会出现重复的行。如果想在结果里留下重复行,可以加上ALL,写作UNION ALL。02 集合运算符有优先级INTERSECT比UNION和EXCEPT优先级更高。03 各个 DBMS 提供...

2019-01-15 00:40:44 1214 1

原创 SQL学习—用关联查询比较行与行

1-6 用关联子查询比较行与行增长、减少、维持现状业务场景:需要用到行间数据比较,使用时间序列的表进行时间序列分析。假设有下面的一张记录了某个公司的营业额的表Sales使用SQL输出与上一年相比营业额是增加还是减少,抑或持平。思路:01 按年份递增的顺序排序02 循环地将每一行与前一行的“sale"列进行比较面向集合的方式,在表Sales的基础上,再加一个存储了上一个数据的集合(S2)...

2019-01-13 21:29:41 679 3

原创 mysql学习—三值逻辑和NULL

1-3 三值逻辑和NULLSQL 布尔型-true false unknown真值优先级and:false &amp;amp;gt; unknown &amp;amp;gt; trueor : true &amp;amp;gt; unknown &amp;amp;gt; falsenull 不是值,不能对其使用谓词(is null)01 排中律不成立排中律不成立: 把命题和它的否命题通过“或者”连接而成的命题全部都是真命题(古典逻辑学)/...

2019-01-10 21:14:29 424

原创 mysql学习—自连接的用法

1-2 自连接的用法可重排列、排列、组合应用场景:假设一张存放了商品名称及价格的表,表里有“苹果、橘子、香蕉”三条记录。在生成用于查询销售额的报表时,需要获取这些商品的组合。组合:分为有顺序的有序对 &lt;1,2&gt; 和 无顺序的无序对 {1,2}。分别对应“排列”和“组合”(1)可重排列通过交叉连接生成笛卡尔积,可以得到有序对/* 用于获取可重排列的SQL语句 */SELEC...

2019-01-09 20:14:14 5561 1

原创 mysql学习—CASE表达式

1-1 CASE表达式CASE表达式概述注意事项:(1)统一各分支返回的数据类型(2)不要忘了写END(3)养成写ELSE子句的习惯/* 把县编号转换成地区编号(1) */SELECT CASE pref_name WHEN '德岛' THEN '四国' WHEN '香川' THEN '四国' WHEN '...

2019-01-08 23:59:29 513

原创 mysql学习—外连接的用法

外连接的用法用外连接进行行列转换(行-&amp;gt;列):制作交叉表三种方法:(1)外连接C0为主表,依次对C1~C3进行外连接。如果某员工学习过某课程,课程出现姓名,否则为null。最后使用case表达式转换为’o’。/* 水平展开求交叉表(1):使用外连接 */SELECT C0.name, CASE WHEN C1.name IS NOT NULL THEN '○' EL...

2019-01-07 23:58:19 1095

原创 mysql学习-having子句

1-4 having 子句寻找缺失的编号a) 进行升序或降序排序b) 循环比较每一行和下一行的编号—查询是否连续/* 如果有查询结果,说明存在缺失的编号 */SELECT '存在缺失的编号' AS gap FROM SeqTblHAVING COUNT(*) &lt;&gt; MAX(seq);—查询缺失编号的最小值/* 查询缺失编号的最小值 */SELECT MIN(s...

2019-01-06 22:51:16 298

原创 大数据的实时计算与离线数据统计 整理学习

大数据的实时计算与离线统计 整理学习1. 实时计算 Apache Storm流程 :业务数据、消息队列、Storm实时编程、Redis、数据展示(秒级计算)应用场景:对数据处理的时效性要求较高,及时响应,秒级甚至毫秒级延迟。example数据处理:对于数据的处理,主要分为3大阶段:数据采集、数据处理、数据的可视化数据采集:1)Magpie实时采集:自主研发,对线上生产...

2018-12-03 20:01:38 6401

原创 如何做番茄炖牛腩——hadoop理解

如何做番茄炖牛腩——hadoop学习注:粗浅了解1.背景作为一个白的不能再白的数据分析师,在给各业务方按需求捞数据的时候,在提取数据的时候总会出现一些map、reduce巴拉巴拉一些奇怪的东西,索性大概系统粗浅的学习下。由于本人浑身带着一种文科安静祥和的气质,又爱好做饭,可能这样瞎B类比有助于自己理解(对错就不知道了)。2.初识MapReduce可以想象自己目标是做一份番茄牛腩,先去偌大...

2018-11-14 18:42:09 232

转载 [整理学习]查询间断点系列问题

[整理学习]查询间断点系列问题1.断点类型1.1 查询间断点缺失数字(如1 2 4 5 7 查询结果 3 6)SELECT IDFROM (SELECT id + 1 AS ID FROM table_02WHERE NOT EXISTS( SELECT * FROM ...

2018-10-21 21:10:22 240

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除