- 博客(24)
- 收藏
- 关注
转载 分区和分桶的区别
1.分区和分桶都是细化数据管理,但是分区表是手动添加区分,由于hive是读模式,所以对添加进分区的数据不做模式检验。分桶表的数据时按住某些分桶字段进行hash散列 相乘的多个文件,所以数据的准确性高很多。2.分区表是指按照数据表的某列或某些列分为多个区,区从形式上可以理解为文件夹3.分桶是相对分区进行更细粒度的划分。分桶将整个数据内容按照某列属性值的hash值进行区分,如果按照name 属性分为3个桶,就是对name属性值的hash值对3取模,按照取模结果对数据分桶。如取模结果为0的数据记录存放到一
2022-05-19 19:25:33 6841
原创 学习java的第九天
集合:存储长度可变的多相同数据的存储模型。集合体系:Collection单列:每个小区域存储的数据只有一个List:重复ArrayListLinkedList...Set:不重复(没有index)HashSetTreeSet...Map双列:每个小区域存储的数据只有一对HashMap...集合体系的关系:实现接口的:Collection Map List Set实现类: ArrayList LinkedList HashSet TreeSet
2022-03-24 17:14:49 133
原创 学习Hadoop的第一天
Hadoop集群搭建(分布式版本)一、准备工作 三台虚拟机:master、node1、node2 时间同步 ntpdate ntp.aliyun.com调整时区cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtimeexport JAVA_HOME=/usr/local/soft/jdk1.8.0_171 jdk1.8 java -version 修改主机名 三台分别执行 vim /etc/ho..
2022-03-21 19:17:51 94
原创 学习Mysql的第四天
22.统计各科成绩各分数段⼈数:课程编号,课程名称,[100-85],[85-70],[70-60],[60-0]及所占百分⽐mysql> select t1.CId -> ,t2.Cname -> ,t1.85to100_cnt -> ,t1.85to100_cnt_percent -> ,t1.70to85_cnt -> ,t1.70to85_cnt_percent -> ,t1.60to70_cnt
2022-03-09 15:45:04 127
转载 学习Mysql的第三天
3.查询存在" 01 “课程但可能不存在” 02 "课程的情况(不存在时显示为 null )mysql> select t1.SId -> ,t2.SId -> from -> ( -> select SId -> from SC -> where CId = '01' -> )t1 -> left join -> ( -> select SId
2022-03-08 19:42:48 103
原创 学习Mysql的第二天
建表语句-- 学生表 Studentinsert into Student values('01' , '赵雷' , '1990-01-01' , '男');insert into Student values('02' , '钱电' , '1990-12-21' , '男');insert into Student values('03' , '孙风' , '1990-12-20' , '男');insert into Student values('04' , '李云' , '19...
2022-03-07 16:37:38 277
原创 学习Mysql的第一天
Centos换源1. 备份mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup2. 下载新的 CentOS-Base.repo 到 /etc/yum.repos.d/CentOS 6curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-6.repoCentOS 7wg
2022-03-03 19:26:56 950
原创 学习Linux的第五天
if格式1:if 判断条件then判断为true执行的代码fi格式2:if 判断条件then判断为ture执行的代码else判断为false执行的代码fi格式3:if 判断条件then判断为true执行的代码elif 判断条件then判断为true执行的代码............else判断为false执行的代码fi注意:else可加可不加判断条件的写法[]:[]两边加空格,符号两边加空格并且符号前加转
2022-03-02 20:24:39 65
原创 学习Linux的第四天
shell操作linux的桥梁创建:后缀为.sh的文件编写:头部注释为#!/bin/sh或者#!/bin/bash(注释可写可不写,建议写上)运行:1.通过sh命令执行例如:sh helloworld.sh2.通过bash命令执行例如:bash helloworld.sh3.通过把文件修改为可执行的文件然后通过./文件命令.sh来执行例如:./helloworld.sh(必须在当前目录下)变量(动态数据类型,没有数据类型的限制,并且必须初始化)定义和初始化
2022-03-02 19:36:49 66
原创 学习Linux的第三天
克隆两台虚拟机加master三台组成一个集群所克隆的虚拟机需要修改主机名,ip永久修改主机名hostnamectl set-hostname node1或node2ip方式1:通过可视化界面直接修改方式2:vim /etc/sysconfig/network-scripts/ifcfg-ens33然后重启网络:service network restart加上映射关系windows下C:\Windows\System32\drivers\etc\hosts19
2022-02-26 21:06:04 460
原创 学习Linux的第二天
用户和用户组用户在/etc/passwd用户组在/etc/group/中注意:在创建用户时。系统默认生成一个用户组(组名和用户名一致)查看用户时:cy:x:1000:1000:cy:/home/cy:/bin/bashcy:用户名x:加密的密码1000:用户编号1000:组编号cy:用户全名称/home/cy:所在位置/bin/bash:可执行命令useradd:添加用户格式:useradd 用户名passwd:修改密码格式:passwd
2022-02-26 20:26:25 604
原创 学习Linux的第一天
安装VmWare 注意事项1.是否启动虚拟化服务2.安装之后是否出现虚拟网卡虚拟化服务禁用如何开启win10系统->更新和安全->恢复->高级启动->疑难解答->高级选项->UEFI固件启动->(有的电脑直接进入BOIS命令,有的电脑需要手动选择BOIS)->虚拟化服务->开启->保存退出安装之后没有出现虚拟网卡1.卸载重装2.下载CClear软件,|扫描清理注册表安装Linux之后VMnet8网络不匹配还原
2022-02-25 21:12:44 608
原创 学习java的第八天
匿名对象:没有名称的对象格式:只开辟空间,不创建引用例如:new Scanner(System.in);注意:匿名对象只能使用一次匿名类:没有名称的类前提:继承或实现格式:new 父类/接口(){方法重写;}本质:一个继承了该类或者实现了接口的子类匿名对象使用多态的形式,创建子类匿名对象异常:程序出现的错误异常体系Throwableerror:系统错误exception:程序错误RuntimeException:运行错误
2022-02-21 16:46:12 64
原创 学习java的第七天
继承:多个类中有相同的属性和方法使用继承子类:被提取的类父类:提出之后的类,存储多个类中有相同的属性和方法的类子类和父类之间产生的关系叫做继承继承是面向对象的三大特征之一,可以使得子类具有父类的属性和方法,还可以在子类中重新定义,追加属性和方法格式:public class 子类名 extend 父类名{}父类又称为基类和超类子类又称为派生类访问变量:就近原则前提:子类中访问变量1.子类局部2.子类成员3.父类成员4.报错调用父类构造:子类中所
2022-02-14 19:50:10 57
原创 学习java的第六天
String:是一个类使用时不需要import(导包)在java中见到的所有双引号包裹起来的内容都是String类的实例(对象)构造:new String() :常创建一个空白的字符串对象new String(char[] c) :根据数组的内容创建字符串对象new String(char[] c , int offset,int length)根据数组的一部分创建字符串对象,通过offset开始获取length个内容String str="abc";当作基本数据类型使用
2022-01-21 11:12:58 1453
原创 学习java的第五天
方法重载:相同的方法有不同的表现形态在同一个类中,定义多个方法,满足以下条件构成方法重载1.在同一个类中2.方法名相同3.参数列表不同(参数数量不同/参数类型不同)4.和返回值类型无关方法重载特点:1.重载仅作于方法的定义,与方法的调用无关2.重载仅针对同一个类中方法的名称和参数进行识别,与返回值无关,不可通过返回值来判断方法是否构成重载方法重载的好处:同一个功能的方法,可以满足不同的需求可变参数:等同于数组格式:数据类型...变量名注意:1.同一个方
2022-01-16 17:18:32 978
原创 学习java的第四天
方法:将具有独立运行的代码块组织(封装)为一个整体,实体具有特殊功能的代码集。无参定义格式1:public static void 方法名(){代码块;}注意:定义在main之外调用:方法名();注意:先定义在调用有参格式定义:public static void 方法名(数据类型 变量名1,数据类型 变量名2 数据类型 变量名n){代码块;}调用:方法名(值1,值2,...值n);注意:保证值和数据类型匹配返回值定义格式publi
2022-01-14 20:04:51 1973
原创 学习java的第三天
数组:存储多个相同数据类型的存储模型定义:格式1:数据类型[] 标识符;格式2:数据类型 标识符[];注意:使用直接使用格式1,因为格式2消耗资源多动态初始化:指定长度,系统分配默认值格式:数据类型[] 标识符=new int[ 长度];访问数组格式:数组名称;访问元素:格式:数组名称[索引];索引(下标):元素(数组中的数据)排列的方式特点:1.0开始2.连续3.递增(每次加1)静态初始化:、初始化时指定每个元素的初始值,由系统决
2022-01-12 19:21:27 451
原创 学习java的第二天
程序流程控制:顺序:java从上向下依次执行分支:if switchif 格式1:单分支if(关系表达式){语句体;}执行流程1.先计算关系表达式的值2.如果关系表达式的值是true,执行语句体3.如果关系表达式的值是false,不执行语句体4.继续执行后面的内容if格式2:双分支if(关系表达式){语句体1;}else{语句体2;}执行流程1.先计算关系表达式的值2.如果关系表达式的值是true,执行语句体1.3..
2022-01-11 22:02:43 40
原创 学习Java的第一天
标识符:程序中自定义的类名 变量名 方法名组成:字母 数字 符号(_ $)java规则:1.数字不可以开头。2.不可以使用关键字。3.区分大小写(大小写敏感)业内规则:见名知意业内规则命名约定(驼峰命名法)2.变量名称为一个单词,全部小写。多个单词第一个单词首字母小写,之后的首字母大写3.类名为一个单词,首字母大写,多个单词全部首字母大写。类型转换:java中不同的数据类型进行相互转换分类:自动类型转换(也叫隐式类型转换)把一个范围小的数据类型或变量赋
2022-01-11 09:54:48 247 1
原创 尚学堂学习java的第一天
1、JDK,JRE,JVM三者之间的关系,以及JDK,JRE包含的主要结构有哪些JDK=JRE+JAVA的开发工具(javac.exe,java.exe,javadoc)JRE=JVM+Java核心类库2.为什么要配置path环境变量?如何配置?path环境变量:windows操作系统执行命令时所需要搜寻的路径为什么要配置path:希望java的开发工具(javac.exe,java.exe)在任何的文件路径下都可以执行成功JAVA_HOME=bin的上一层目录path=%JAVA_HOME
2022-01-09 22:05:05 73
原创 学习大数据的第一天
软件系统软件:dos命令窗口应用软件:QQ Wechar人机交互图形化界面DOS命令窗口DOS 打开方式1:导航条中输入cmdDOS打开方式2:win+R中输入cmd区别:方式1 在什么位置输入cmd,dos就在什么位置方式二 打开,dos 位置在桌面dos命令ipconfig 查看IP地址盘符:切换盘符dir 查询当前目录下所有(不包括隐藏)内容cd 目录 切换单击目录(文件夹)cd 目录\目录 切换多级目录cls 清屏exit 退出
2022-01-08 20:43:23 797
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人