自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 收藏
  • 关注

原创 7.分区表和分桶表

海量数据就非常需要分区表,防止一张表格的数据量太大,避免全表扫描

2023-05-09 18:05:05 617

原创 6.其他函数

这一章用的不多

2023-05-09 11:38:33 585

原创 5.窗口函数

常见开窗函数

2023-05-08 21:00:12 132

原创 4.HIVE函数

if函数,case函数,合并行,拆分行

2023-05-08 16:10:24 557

原创 3.Hive基础命令练习

本质其实是mysql的复习

2023-05-07 16:53:13 708

原创 2.Hive创建数据库

介绍了数据库和数据表的增删改查

2023-05-06 15:12:54 2417

原创 1.Hive基础

介绍了hive的启动和常见数据类型

2023-05-02 18:01:43 665

原创 12.Hadoop练习题

说明NN和DN的集群ID不一致,一般发生在HDFS已经可以使用,又二次格式化NameNode,使NameNode得到了一个新的集群ID,造成两者不匹配,修改NN的ID为DN,在data/dfs/name/current下面,vim version.把其中。3. ‘func.sh xxx N’,xxx为任意字符串,N为整数,输出N行xxx。1. ‘func.sh jiahe N’,N为整数,返回1+...+N的和。2. ‘func.sh jiecheng N’,N为整数,返回N的阶乘。

2023-04-28 22:37:07 1132

原创 11.Hadoop优化

这一部分看看就好,建立优化的思想,实际企业不会用

2023-04-28 11:11:32 542

原创 10.Yarn概述

这一章好无聊啊

2023-04-27 16:19:35 974

原创 9.Join的应用

此章可以称为是hive的基础

2023-04-26 18:10:28 417

原创 8.OutPutFormat

这块比较简单,没啥好说的

2023-04-24 17:02:48 86

原创 7.Shuffle详解

学的也是思想,实际生产不用。spark和flink的代码看了还有点用,但是mapReduce看了也是白看

2023-04-24 12:23:56 468

原创 6.MapReduce(1)

inputFormat与shuffle

2023-04-23 16:45:32 385

原创 5.MapReduce概述

ps.实际生产环境中并不会使用mapReduce,而是spark和flink,但是它可以建立分布式的思想。

2023-04-20 23:16:44 174

原创 4.HDFS概述

HDFS概述

2023-04-16 23:18:32 443

原创 3.HADOOP后续配置

第二节的后续

2023-04-11 16:06:15 206

原创 2.Hadoop集群环境搭建

ps.集群一般公司都会搭建好,除非你去的是初创型公司。

2023-04-10 00:25:43 173

原创 6.队列(Queue)

队列

2023-03-21 21:53:12 55

原创 5. 栈(Stack)

2023-03-20 21:49:50 48

原创 4.双向链表

双向链表/循环链表

2023-03-20 16:29:17 37

原创 3.链表(Linked List)

单向链表

2023-03-19 21:47:46 43

原创 2.数组(ArrayList)

数组

2023-03-17 17:02:52 46

原创 1.数据结构(复杂度)

复杂度计算

2023-03-15 10:58:34 64

原创 3.pandas练习题(数据处理)

复习

2023-03-14 09:37:41 360

原创 3.Pandas练习题(基础)

13.对数据按照"popularity"列值的大小进行排序。8.提取popularity列值大于3小于7的行。3.统计grammer列中每种编程语言出现的次数。5. 提取popularity列中值大于3的行。10.提取popularity列最大值所在行。12.添加一行数据['Perl',6.6]14.统计grammer列每个字符串的长度。1.提取含有字符串"Python"的行。6.按照grammer列进行去除重复值。4.将空值用上下值的平均值填充。2. 输出df的所有列名。11.删除最后一行数据。

2023-03-13 16:01:04 249

原创 3.Pandas数据预处理

【代码】2.Pandas数据预处理。

2023-03-13 11:29:57 43

原创 2.Pandas常用函数汇总

(1)原表格 (2)行索引排序 (3)列索引排序。从左到右依次为内/左/右/外连接。

2023-03-13 10:55:54 43

原创 1.numpy常用函数汇总

【代码】1.numpy复习。

2023-03-10 17:23:46 35

原创 01.RNN入门

RNN入门

2023-02-11 22:21:15 89

原创 02.卷积神经网络入门

cnn入门

2023-02-10 13:12:16 79

原创 01.深度学习入门

深度学习基础知识,应该还有下期

2023-01-15 20:13:45 302

原创 01.Hadoop入门

没有写完,明天继续写

2023-01-14 17:45:34 328

原创 05.Linux之shell入门

Shell的相关知识

2022-12-14 18:51:37 54

原创 04.linux常见命令03

设置定时任务 软件包管理

2022-12-08 21:51:38 223

原创 03.liunx基本命令02

文件权限类,搜索查找类,压缩解压类,进程线程类命令

2022-12-07 21:57:11 55

原创 02.liunx常用命令01

文件目录类,时间日期类,用户管理类命令

2022-12-06 12:17:05 101

原创 01.linux基础知识

linux基础01

2022-12-05 08:35:41 54

原创 01.maven的常见操作

maven

2022-11-29 21:24:25 215

原创 05.mysql高级教程

数据库基本知识

2022-10-06 21:31:13 300

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除