- 博客(32)
- 收藏
- 关注
原创 hive面试题
文档:Hive.note链接:http://note.youdao.com/noteshare?id=82a0fa7c47703117cd4dfa6cbc778960&sub=264C3484964C46D69B7850ED1A0B48A2
2021-05-20 10:32:01
87
原创 虚拟机上部署OOTB环境
文档:虚拟机上部署OOTB环境(联网).note链接:http://note.youdao.com/noteshare?id=86ad716c5517b2a80180e1349d616328&sub=04A9A4841C4446E591AACFDF531D89E6
2021-05-20 10:27:28
216
原创 分布式文件系统HDFS(hadoop distribute file system)
文档:分布式文件系统HDFS(Hadoop distribute…链接:添加链接描述
2021-05-20 10:25:37
72
原创 安装Scrapy
首先要安装好Python环境,以前Scrapy只能应用于Python2,现在Python3也能了Python3下载安装好后配置好环境变量path后@安装方法首先安装wheelpip install wheel1安装完成后验证是否成功wheel1安装成功是这样然后去网站http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml下载Scrapy库,进到网站=>搜索’Scrapy’=>下载把下载的.whl文件放在一个容易寻找的地址(我放在了
2021-04-21 22:01:58
53
原创 HQL四种排序
order bysort bydistribute bycluster by每个MapReduce内部排序(Sort By)Sort By:每个Reducer内部进行排序,对全局结果集来说不是排序。1.设置reduce个数hive (default)> set mapreduce.job.reduces=3;2.查看设置reduce个数hive (default)> set mapreduce.job.reduces;3.根据部门编号降序查看员工信息hive (defau
2021-04-21 00:42:10
892
原创 SQL调优的几种方式
SQL1、脚本创建和删除数据库(和手动一样的效果)pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings('ignore')import
2021-04-21 00:21:49
198
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人