自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

墨染百城

士别三日,当刮目相看

原创 【LeetCode】LeetCode中那些应该背下来的经典代码

收集在刷LeetCode过程中遇到的经典代码,持续更新。136. Single Number中使用异或求解问题描述问题链接:https://leetcode.com/problems/single-number/#/descriptionGiven an array of integers, ev...

2017-03-17 10:52:10 1600 1

原创 看到一个好句子,记下来

人一能之,己百之;人十能之,己千之。果能此道矣,虽愚,必明;虽柔,必强。–《礼记》

2017-07-05 15:26:29 440 0

原创 OKR学习笔记

1. 什么是OKROKR的全称是“Objectives and Key Results”,翻译过来就是“目标和关键成果”。它是一种目标管理方法,是一种能够让企业更好的聚焦战略目标,更好的集中配置资源,更好的使团队上下同欲的管理方法。2. OKR是怎么来的2.1 起源1954年,德鲁克在《管理的实践...

2017-06-22 18:45:11 993 0

原创 【算法】算法的时间复杂度计算

计量单位为了便于比较同一个问题的不同算法,通常的做法是,从算法中选取一种对于所研究的问题(或算法类型)来说是基本操作的原操作,以该基本操作的重复执行的次数作为算法的时间量度。时间频度一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数...

2017-06-14 17:28:05 955 0

原创 用Python一键搭建Http服务器

用Python一键搭建Http服务器今天好友问我怎么从阿里云服务器上把文件下载下来。我一听之下觉得办法很多啊,随意搭个服务器,然后把文件一丢就可以下载了;弄个FTP也行;直接用远程桌面往下拖也可以。考虑到便捷性,觉得上面的办法都比较麻烦,最好能有个直接解决问题的办法。然后就找到了Python里面。...

2017-05-22 21:15:22 6432 0

原创 职场初体验

今天是一辈子第一次上跟专业相关的班。有点小忐忑。本来以为要见识早高峰了,但是实际上并没多少人,居然还有点小不甘心。。。不过想想以后早上不用早高峰,实际上放松了好多。出了地铁站就遇到了小黄车,哈哈,运气超好。所以提前到了一会儿。在周围熟悉一下环境。然后就被HR姐姐接到楼上了。先是填了一些表,然后熟悉...

2017-04-06 22:29:59 954 0

原创 【书山有路】SQL必知必会 第22课

第15课到21课也看过了,感觉没有什么记笔记的需要。本课很重要,一定要记一下。本课的主题是“高级SQL特性”,介绍约束、索引和触发器。概念 约束:管理如何插入或处理数据库数据的规则。 约束引用完整性利用键来建立一个从一个表到另一个表的引用,保证只在表中插入合法(存在于引用列)的数据。主键保证一列中...

2017-04-05 09:59:23 591 0

原创 【书山有路】SQL必知必会 第14课

本课的主题是“组合查询”,讲述如何利用UNION操作符将多条SELECT语句组合成一个结果集。组合查询主要有两种情况使用组合查询: 在一个查询中从不同的表返回结构数据 对一个表执行多个查询,按一个查询返回数据 UNION规则 UNION必须由两条或两条以上的SELECT语句组成。 UNION中的每...

2017-04-04 23:48:53 468 0

原创 【书山有路】SQL必知必会 第13课

本章的主题是“创建高级联结”,主要介绍如何使用表别名,如何对被联结的表使用聚集函数。提示 表的别名只在查询执行中使用,不返回到客户端。 使用表别名SQL允许给表名起别名,有两个主要理由: 缩短SQL语句 允许在一条SELECT语句中多次使用相同的表 自连接自连接通常作为外部语句,用来替代从相同表中...

2017-04-04 23:37:07 520 0

原创 【书山有路】SQL必知必会 第12课

本章的主题是“联结表”,主要介绍什么是联结,为什么使用联结,如何编写使用联结的SELECT语句。概念 由没有联结条件的表关系返回的结果为笛卡尔积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数。笛卡尔积又称为Cross Join 警告 要保证所有的联结都有WHERE子句,否则DBMS将返...

2017-04-04 23:14:32 547 0

原创 【SQL练习】经典SQL练习题

准备数据建表语句CREATE TABLE students (sno VARCHAR(3) NOT NULL, sname VARCHAR(4) NOT NULL, ssex VARCHAR(2) NOT NULL, sbirthday DATETIME, class VARCHAR(5))C...

2017-04-03 18:12:08 99155 72

原创 【书山有路】SQL必知必会 第11课

本章的主题是“使用子查询”,介绍什么是子查询,以及如何使用它们。提示 在WHERE子句中使用子查询能够编写出功能很强且很灵活的SQL语句。对于能嵌套的子查询的书目没有限制,不过在实际使用时由于性能的限制不能嵌套太多的子查询。 也可以在计算字段中使用子查询。 警告 使用子查询并不总是执行这类数据检索...

2017-04-03 15:45:20 692 0

原创 Flume安装及使用示例

Flume概述 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中 一般的采集需求,通过对flume的简单配置即可实现 Flu...

2017-04-03 15:33:31 374 0

原创 【LeetCode】258. Add Digits

问题描述问题链接:https://leetcode.com/problems/add-digits/#/descriptionGiven a non-negative integer num, repeatedly add all its digits until the result has o...

2017-04-03 12:54:48 470 0

原创 一道Hive面试题:累积报表

我们有如下的用户访问数据: userId visitDate visitCount u01 2017-01-21 5 u02 2017-01-23 6 u03 2017-01-22 8 u04 2017-01-20 3 u01 20...

2017-04-02 20:29:44 2391 1

原创 【书山有路】SQL必知必会 第10课

本章的主题是“分组数据”,介绍如何分组数据,以便汇总表内容的子集。涉及到GROUP BY和HAVING子句。提示 使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。 HIVING支持所有WHERE操作符。 WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。 创建分组分组是使用...

2017-04-02 19:21:44 404 0

原创 【书山有路】SQL必知必会 第9课

本章的主题是“汇总数据”,介绍什么是SQL聚集函数,以及如何利用它们汇总表的数据。警告 AVG只能用来确定特定数值列的平均值,列名必须作为参数给出。为了获得多个列的平均值,必须使用多个AVG函数。 AVG函数忽略列值为NULL的行。 MAX函数忽略列值为NULL的行。 MIN函数忽略列值为NULL...

2017-04-02 00:08:13 333 0

原创 【书山有路】SQL必知必会 第8课

本章的主题是“使用数据处理函数”,介绍什么是函数,如何使用这些函数;还将讲解为什么SQL函数的使用可能会带来问题。概念 可移植:所编写的代码可以在多个系统上运行。 提示 为了代码的可移植性,许多SQL程序员不赞成使用特定于实现的功能。虽然这样做很有好处,但有的时候并不利于应用程序的性能。如果不使用...

2017-04-01 15:33:32 332 0

原创 Hive TransForm案例

Hive的 TRANSFORM 关键字提供了在SQL中调用自写脚本的功能,适合实现Hive中没有的功能又不想写UDF的情况。步骤1、先加载rating.json文件到hive的一个原始表 rat_jsoncreate table rat_json(line string) row format d...

2017-04-01 13:36:51 2131 0

原创 Hive中的UDF及自定义函数示例

Hive官方的UDF手册地址是:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF测试内置函数的快捷方法创建一个表dualload数据到dual表尝试内置函数自定义函数例子有时候Hive提供的内置函数不能满足我们的...

2017-04-01 13:25:06 962 0

原创 广告精准推送项目介绍

广告中介商:每个用户的目标客户不同,找的广告位也就不一样。广告提供商(网站、APP):想拉业务,也去找中介。将广告栏位提供给中介商。广告用户(各行业厂商):想去打广告,需要去找一些广告提供商。但是很难找到靠谱的,所以需要去找中介商。如果是一个综合网站,同一个广告栏位需要根据不同的浏览者展示不同的广...

2017-04-01 12:16:40 2975 0

原创 Hive中的Join操作

Hive中有许多的Join操作,如果LEFT,RIGHT和FULL OUTER JOIN,INNER JOIN,LEFT SEMI JOIN等。那么它们都各自有什么特点呢?感觉很难说明这些区别,还是通过例子来看。准备数据如果我们有一个表,数据如下:a.txt1,a 2,b 3,c 4,d 7,y ...

2017-04-01 11:27:12 733 0

原创 【书山有路】SQL必知必会 第7课

本章的主题是“创建计算字段”,介绍什么是计算字段,如何创建计算字段,以及如何从应用程序中使用别名引用它们。概念 字段:基本上与列的意思相同,经常互换使用,不过数据库列一般称为列,而术语字段通常与计算字段一起使用。 拼接:将值联结到一起(将一个值附加到另一个值)构成单个值。 提示 只有数据库知道SE...

2017-04-01 10:31:56 414 0

原创 【书山有路】SQL必知必会 第6课

本章的主题是“用通配符进行过滤”,主要介绍什么是通配符,如何使用通配符以及怎样使用LIKE操作进行通配搜索。概念 通配符:用来匹配值的一部分的特殊字符。 搜索模式:由字面值、通配符或者两者构成的搜索条件。 谓词:取值为TRUE、FALSE或UNKNOWN的表达式。 提示 当操作符是谓词时,它不是操...

2017-04-01 09:59:23 473 0

原创 【书山有路】SQL必知必会 第5课

这一课讲授的主题是“高级数据过滤”,组合WHERE子句建立功能更强的搜索条件。还将学习NOT和IN操作符。提示 WHERE子句中的AND操作符优先级高于OR操作符。所以应该使用圆括号正确的分组。 IN操作符IN操作符用于范围匹配,范围中的每个条件都可以进行匹配。使用下面的代码:SELECT pro...

2017-03-31 13:24:48 526 0

原创 【书山有路】SQL必知必会 第4课

这一章的主题是“过滤数据”,讲授如何使用SELECT的WHERE子句指定搜索条件。提示 数据也可以在应用层过滤,SQL检索出超出实际所需的数据,然后客户端代码提取出需要的行。通常这种做法及其不妥,让客户端应用处理数据库的工作会极大地影响应用的性能,并且使创建的应用不具备可伸缩性。还将导致网络带宽的...

2017-03-31 13:13:05 496 0

原创 【书山有路】SQL必知必会 第3课

这一课的主题是“排序检索数据”,主要讲授如何使用ORDER BY子句。概念 子句:SQL语句由子句构成,有些字句是必须的,有些则是可选的。一个子句通常由一个关键字加上所提供的数据组成。 提示 在指定一条ORDER BY子句时,应该保证它是SELECT语句中最后一条子句。如果它不是最后的子句,将会出...

2017-03-31 12:59:24 409 0

原创 【书山有路】SQL必知必会 第2课

这一课的主题是“检索数据”,介绍如何使用SELECT语句从表中检索一个或多个数据列。提示 SQL语句后要加分号 对SQL关键字使用大写,对列名和表命使用小写。这样做使代码更易于调试和阅读。 多数SQL开发人员认为,将SQL语句分成多行更容易阅读和调试。 SQL语句一般返回原始的、无格式的数据。数据...

2017-03-31 12:47:48 613 0

原创 【书山有路】SQL必知必会 第1课

这一课介绍SQL究竟是什么,它能做什么事情。概念 模式:表具有一些特性,这些特性定义了数据在表中如何存储,包含存储什么样的数据,数据如何分解,各部分信息如何命名等信息。描述表的这组信息就是所谓的模式(schema)。模式可以用来描述数据库中特定的表,也可以用来描述整个数据库(和其中表的关系)。 数...

2017-03-31 11:44:20 521 0

原创 Hive分桶的作用

分区的主要作用是可用允许我们只统计一部分内容,加快统计的速度。什么是分桶假如我们有个表t_buck。create table t_buck(id string,name string) clustered by (id) sort by(id) into 4 buckets; 指定了根据id分成4...

2017-03-30 17:01:40 7541 0

原创 Hive HQL练习

测试数据course.txt1,数据库 2,数学 3,信息系统 4,操作系统 5,数据结构 6,数据处理 sc.txt95001,1,81 95001,2,85 95001,3,88 95001,4,70 95002,2,90 95002,3,80 95002,4,71 95002,5,60 95...

2017-03-30 15:15:46 6535 1

原创 Hive建表语句和分区表概念及示范

Hive的建表语句CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PA...

2017-03-30 12:12:24 2716 0

原创 纪念博客排名进入前20000

从2017年1月20多号开始写博客,到现在差不多正好两个月吧。体验到了许许多多的新技术,解决了许许多多的新问题,也读过许许多多前辈的好文,甚至还鼓舞了几个小伙伴也开始写博客了。这个博客的陪伴真的带给我很多的快乐。在这个过程中有收获,但更多的是意识到了自己的不足。这里说得重一点,就是学习的时候不求甚...

2017-03-30 10:30:43 335 3

原创 【SQL练习】175. Combine Two Tables

问题连接:https://leetcode.com/problems/combine-two-tables/#/description问题描述Table: Person+-------------+---------+ | Column Name | Type | +------------...

2017-03-30 10:17:22 472 0

原创 【LeetCode】226. Invert Binary Tree

问题描述问题链接:https://leetcode.com/problems/invert-binary-tree/#/descriptionInvert a binary tree. 4 / \ 2 7 / \ / \ 1 3 6 9 to 4...

2017-03-28 21:22:22 235 0

原创 【LeetCode】371. Sum of Two Integers

问题描述问题链接:https://leetcode.com/problems/sum-of-two-integers/#/descriptionCalculate the sum of two integers a and b, but you are not allowed to use the...

2017-03-28 20:55:46 314 0

原创 【书山有路】大型网站技术架构 第1章

今天去逛书店,本来只想买本SQL的书,拿起来看了看,觉得是本科普的好书,介绍很多我不懂的东西。遂买下,准备好好读读。说实话已经有很久没有读完过一本书了,甚至都怀疑自己还能不能从头到尾读完一本书。觉得这本书很有趣,适合拿来建立自信。所以要把它读完。本章的标题是“大型网站架构演化”。金句 希望软件工程...

2017-03-28 18:57:30 274 0

原创 【LeetCode】53. Maximum Subarray

问题描述问题链接:https://leetcode.com/problems/maximum-subarray/#/descriptionFind the contiguous subarray within an array (containing at least one number) wh...

2017-03-27 11:25:34 477 0

原创 【书山有路】立Flag,我要精通Java

计划和总结2017.03.27这几天面试、笔试的过程中不断的被问到Java底层相关的知识,而我从来没有认真的学习过Java,都是需要了就百度,典型的面向搜索引擎编程,所以场面就尴尬了。。。今天早上有幸拜读了左潇龙大大的博文:万能的林萧说:一篇文章教会你,如何做到招聘要求中的“要有扎实的Java基础...

2017-03-27 10:50:47 724 0

原创 【书山有路】快学Scala 第1章

由于课程的需要,要开始学习Scala了。感觉最近的线程开得有点多啊,争取能做到平衡发展吧。本章的主题是“基础”,主要介绍一系列重要的Scala概念和惯用法。同时还会学到如何浏览Scaladoc文档。要点包括: 使用Scala解释器 用var和val定义变量 数字类型 使用操作符和函数 浏览Scal...

2017-03-26 22:25:38 276 0

提示
确定要删除当前文章?
取消 删除