自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Hive笔记-20210327

Hive自定义函数1.UDF(user-defined-function)一进一出 eg: 将单词全部大写2.UDAF(user-defined aggregation function)聚集函数 多进一出类似于 count/max/min3.UDTF(user-defined table-generating functions)一进多出基本概念大数据解决海量数据的传输、存储、计算(处理)hive 用于解决海量结构化日志的数据统计hive是基于Hadoop的数据仓库工具,可以将

2021-03-27 21:44:05 104

原创 java学习笔记-20210327

window 命令行操作进入d盘 d:呈现目录结构 dir新建文件目录:md 文件夹名字eg:cd java进入该文件夹 cd d:\java在该文件夹中创建文件夹也用md退出该目录返回到上一级目录 cd…回到根目录下 cd\创建文件 eg:将name:tom 写到1.doc中 echo name:tom>1.doc删除文件 del 1.doc删除所有txt的文件 del *.txt删除文件目录 rd team1(必须保证目录为空才能删掉)del team1 则删除的是tea

2021-03-27 09:25:52 89 1

原创 20210322 HDFS

HDFS特点适合一次读入 多次写出优点高容错性:数据自动保存多个副本,通过增加副本的形式,提高容错性某个副本丢失以后,可以自动恢复适合处理大数据数据规模文件规模可以构建在廉价机器上,多副本机制,提高可行性缺点不适合低延时的数据访问无法高效的对大量小文件进行存储存储大量小文件会占用NameNode大量内存来存储文件目录和块信息,NameNode内存是有限的小文件存储寻址时间会超过读取时间不支持并发写入、文件随机修改一个文件只能有一个 写,不允许多个线程同时写仅支

2021-03-22 11:14:15 161

原创 Hadoop常用端口号及配置文件

端口号Hadoop 3.xHDFS NameNode 内部通常端口号:8020/9000/9820HDFS NameNode 对用户的查询端口:9870Yarn 查看任务的运行情况:8088历史服务器:90080Hadoop 2.xHDFS NameNode 内部通常端口号:8020/9000HDFS NameNode 对用户的查询端口:50070Yarn 查看任务的运行情况:8088历史服务器:19888常用的配置文件3.xcore-site.xmlyarn-site.xml

2021-03-21 20:46:16 1281

原创 SQL子查询1

子查询MySQL筛选组中一些特殊值问题1 查询平均工资最低的部门信息解法1 多个子查询嵌套1.查找各部门的平均工资select avg(salary),dept_idfrom enployeesgroup by dept_id2.查询1结果上的平均工资最低的值select min(ag)from (select avg(salary) ag,dept_id from enployees group by dept_id) ag_dep;3.查出工资最低的部门id第2步

2021-03-21 17:11:11 116

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除