自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 【SQL】拼表法插入数据

实习过程中学到的一个SQL小技能,把它记录下来。 很多时候我们想要在公司的hive表里插入数据,但是没有办法直接导入文件怎么办?拼表法就能解决这个问题。 例如,我想要手动插入数据得到下图这样一张表: 可以用下面一段代码实现: select * from (select 1 as aa...

2019-04-26 17:52:52 150 0

原创 【LeetCode】数据库练习题

LeetCode上面公开的几道SQL题结果,欢迎大家讨论。 (https://leetcode-cn.com/problemset/database/)   175. 组合两个表【简单】 表1:Person(Id 是主键) +-------------+---------+ | 列名 ...

2018-08-20 00:08:15 607 0

原创 【牛客】网易2018校园招聘数据分析工程师笔试卷

【牛客】网易2018校园招聘数据分析工程师笔试卷解析 * 选择题根据牛客网下方讨论整理,三道大题未做,欢迎大家讨论并给予指正。 (https://www.nowcoder.com/test/10730167/summary) 一、选择题 1、某二叉查找树的每个节点存放一个整数,中序遍历该树...

2018-08-18 21:56:10 1529 0

原创 【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析

【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析 * 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正。 (https://www.nowcoder.com/test/10780714/summary)   第二道sql参考(https://bbs.cs...

2018-08-18 18:51:37 12052 1

原创 【牛客】网易2018校招数据分析师笔试解析

【牛客】网易2018校招数据分析师笔试解析 * 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正。 (https://www.nowcoder.com/test/10778804/summary) 一、选择题 1、有2堆宝石,A和B一起玩游戏,假设俩人足够聪明,规...

2018-08-18 00:18:35 8613 1

原创 【牛客】摩拜2018校招数据分析工程师笔试解析

【牛客】摩拜2018校招数据分析工程师笔试解析 * 选择题都有正确答案,后面五道大题均是我的答案,欢迎大家讨论纠正! (https://www.nowcoder.com/test/11453292/summary) 一、选择题 1、在Shell编程中,下面哪个表示上一步所运行程序的返回值(...

2018-07-23 10:44:46 1852 0

原创 【牛客】2018京东秋招数据分析工程师笔试解析

【牛客】2018京东秋招数据分析工程师笔试解析 * 根据牛客网下方讨论整理(https://www.nowcoder.com/test/10630596/summary) 一、选择 1、有一个文件user.txt,每行一条user记录,共若干行,下面哪个命令可以实现“统计出现次数最多的前3个...

2018-07-20 00:09:40 5686 2

原创 【牛客】剑指offer部分编程题(持续更新......)

【牛客】剑指offer部分编程题(持续更新......)   一、替换空格 请实现一个函数,将一个字符串中的每个空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。 class Solution: # s 源字...

2018-07-16 23:25:21 197 0

原创 win10安装spark流程

win10安装spark流程说明安装步骤分为java,scala,spark和hadoop四步,以下是对我整个安装过程的记录。一、安装JDK官网下载了8u172版本。点击打开链接安装完毕以后,添加环境变量JAVA_HOME、增加环境变量path路径。打开cmd键入java -version,看到如...

2018-05-12 15:38:56 3015 5

原创 python爬豆瓣影评&根据词频生成词云

python爬豆瓣影评&根据词频生成词云通过爬取豆瓣上正在上映的电影影评信息,并根据评论词频生成词云。一、需要的包import warnings # 防止出现future warning warnings.filterwarnings("ignore") fr...

2018-05-06 10:11:50 3352 0

原创 python用matplotlib画条形图初探(单变量,双变量堆叠)

python用matplotlib画条形图初探(单变量,双变量堆叠)一、包import numpy as np import matplotlib.pyplot as plt二、单变量(垂直)y = [5, 10, 15, 20, 25] index = np.arange(len(y)) plt...

2018-05-05 16:03:18 7810 0

原创 git远程操作入门

git远程操作入门 一、建立本地库 新建文件夹 -> 改变目录 -> 初始化 ~/Desktop $ mkdir learngit ~/Desktop $ cd learngit ~/Desktop/learngit $ git init Initi...

2018-04-22 16:29:52 114 0

原创 周志华《机器学习》第四章决策树-调用sklearn.tree实现

周志华《机器学习》第四章决策树-调用sklearn.tree实现一、导入需要用的包import csv # 导入文件 import pandas as pd from sklearn.feature_extraction import DictVectorizer # 用于生成哑变量 from...

2018-04-14 23:17:19 454 1

原创 【TIPS】更改jupyter notebook工作空间

【TIPS】更改jupyter notebook工作空间一、打开任意工作目录,图片中显示的是C盘二、shift+点击右键,选择打开powershell窗口三、键入jupyter notebook四、在默认浏览器弹出home界面,显示的都是C盘的内容...

2018-04-14 18:06:36 344 0

原创 周志华《机器学习》第四章决策树-编程尝试

周志华《机器学习》第四章决策树-编程尝试 一、导入需要用到的包 ''' import math import re from sklearn.externals.six import StringIO from pydotplus import graphvi...

2018-04-14 17:32:53 201 1

原创 【TIPS】关于matplotlib包plt.show()画图中文字符乱码

关于matplotlib包plt.show()画图中文字符乱码%matplotlib inline import matplotlib.pyplot as plt years = [1950, 1960, 1970, 1980, 1990, 2000, 2010] gdp = [300.2, 5...

2018-04-11 21:29:30 735 0

原创 markdown使用过程中遇见的问题(持续更新)

markdown使用过程中遇见的问题(持续更新)一、markdownpad2无法正确显示公式解决方法:需要在MarkdownPad2里加入 MathJax CDN,方法如下:工具→选项→高级→HTML Head编辑器,在打开的窗口里输入下面的内容:<script type="...

2018-04-11 21:25:08 521 0

原创 R使用过程中遇见的问题(持续更新)

R使用过程中遇见的问题(持续更新)一、无法安装包并返回如下信息cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'解决方法:更换镜像,使用国内镜像即可。tools-global options-packa...

2018-04-10 23:08:59 336 0

原创 Regex Golf 正则表达式练习(持续更新)

Regex Golf 正则表达式练习初步接触正则化表达式,本文记录regex golf(alf.nu/RegexGolf)上题目答案,一些拙见,欢迎指正或给出更好的答案。一、Warmup二、Anchors三、It never ends法一:(?!\w)表示后面没有字母法二:法三:\b为边界匹配,后...

2018-03-18 15:43:24 4361 4

原创 python使用过程中遇见的问题(持续更新)

python使用过程中遇见的问题(持续更新)一、wordcloud安装问题在使用pip install wordcloud安装wordcloud过程中遇见如下问题即 error: Microsoft Visual C++ 14.0 is required. Get it with "Mi...

2018-03-10 17:42:57 562 0

原创 图灵程序丛书 —《数据科学入门》— Ch9-Ch10 获取数据、数据工作

Ch9-Ch10  获取数据、数据工作此系列记录《数据科学入门》学习笔记(停止)Chap 9 获取数据(只有9.2)9.2 读取文件9.2.1 文本文件基础# 'r'意味只读 file_for_reading = open('reading_file.txt'...

2018-03-09 21:09:49 160 0

原创 图灵程序丛书 —《数据科学入门》— Ch8 梯度下降法

Ch8 梯度下降法此系列记录《数据科学入门》学习笔记8.2 梯度下降的思想梯度下降法只能找到局部最优解,而不是全局最优解;当有多个全局最优解时,可以通过多尝试一些初始点来重复搜索;当一个函数没有最小点时,计算可能会陷入死循环。8.2 估算梯度def sum_of_squares(v): r...

2018-03-08 17:54:59 378 0

原创 图灵程序丛书 —《数据科学入门》— Ch4-Ch7 线性代数、统计学、概率、假设与推断

Ch4-Ch7 线性代数、统计学、概率、假设与推断此系列记录《数据科学入门》学习笔记Ch 4 线性代数4.1 向量# 向量加减法 def vector_add(v, m): return [v_i + w_i for v_i, w_i in zip(v, w)] def vector_...

2018-03-05 17:59:06 166 0

原创 图灵程序丛书 —《数据科学入门》— Ch3 可视化数据(matplotlib)

Ch3 可视化数据此系列记录《数据科学入门》学习笔记3.1 matplotlib%matplotlib inline import matplotlib.pyplot as plt years = [1950, 1960, 1970, 1980, 1990, 2000, 2010] gdp = ...

2018-02-27 16:54:42 183 0

原创 MySQL入门(终结)- 常用语句简单总结

MYSQL简单总结SQL的分类数据查询语言(DQL - data querylanguage):select(针对表中数据)数据操纵语言(DML - datamanipulation language):insert、delete、update(针对表中数据)数据定义语言(DDL - data d...

2018-02-24 20:34:52 277 0

原创 MySQL入门(12)- 索引&视图&导入/导出

索引&视图&导入/导出此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、              ...

2018-02-24 15:46:12 590 0

原创 MySQL入门(11)- 事务

事务此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       ...

2018-02-24 15:40:20 155 0

原创 MySQL入门(10)- 存储引擎

存储引擎此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                     ...

2018-02-24 15:36:29 226 0

原创 MySQL入门(9)- 34道练习题(内含bjpowernode.sql数据)

34道练习题(内含bjpowernode.sql数据)此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末。* 该数据有三张表:部门表dept(deptno部门编号、dname部门名称、loc位置)、                             ...

2018-02-24 10:07:47 9306 8

原创 MySQL入门(8)- 约束——主键约束&外键约束&级联更新/删除

约束——主键约束&外键约束&级联更新/删除此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置...

2018-02-23 11:12:36 468 0

原创 MySQL入门(7)- 约束——非空约束&唯一性约束

约束——非空约束&唯一性约束此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、             ...

2018-02-23 11:00:53 2543 0

原创 MySQL入门(6)- 创建表、表的复制、增/删/改 表结构

创建表、表的复制、增/删/改 表结构此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                 ...

2018-02-23 10:49:09 432 0

原创 MySQL入门(5)- 子查询&union&limit&case...when...then...when...then...end

子查询&union&limit&case...when...then...when...then...end此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有...

2018-02-23 10:27:25 423 0

原创 MySQL入门(4)- 连接查询、跨表查询

连接查询、跨表查询此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,我也没有,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                     ...

2018-02-21 21:03:10 412 1

原创 MySQL入门(3)- 分组函数(count、sum、avg、max、min)&分组查询(groupby、orderby)

分组函数&分组查询此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                  ...

2018-02-21 20:50:03 1831 0

原创 MySQL入门(2)- 排序&数据处理函数&日期处理函数

排序&数据处理函数&日期处理函数此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、   ...

2018-02-20 21:32:59 231 0

原创 MySQL入门(1)- SQL语句分类&查询语句

SQL语句分类&查询语句此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、               ...

2018-02-20 21:21:46 445 0

原创 图灵程序丛书 —《数据科学入门》— Ch2 Python 速成

Ch2 Python 速成此系列记录《数据科学入门》学习笔记2.1 基础内容2.1.3 空白形式python使用缩进的形式分隔代码块,可利用‘Tab’键快速找到键入位置。for i in [1, 2, 3, 4, 5]: print(i) for j in [1, 2, 3, 4,...

2018-01-31 18:14:16 164 0

原创 图灵程序丛书 —《数据科学入门》— Ch1 导论

Ch1 导论此系列记录《数据科学入门》学习笔记1.3.1 寻找关键联系人1、定义users字典listusers = [ {'id': 0, 'name': 'Hero'}, {'id': 1, �...

2018-01-30 16:03:27 139 0

提示
确定要删除当前文章?
取消 删除