- 博客(11)
- 收藏
- 关注
原创 Hive内部表和外部表区别
Hive内部表:默认创建的表就是内部表。Hive完全管理表(元数据和数据)的生命周期,类似于RDBMS的表。当删除表时,它会删除源数据以及表的元数据。Hive外部表:外部表的数据不是Hive拥有或者管理的,只管理元数据的生命周期。要创建一个外部表,需要使用external关键字。删除外部表时只会删除元数据,而不会删除实际数据(源数据)。在hive外部依然可以访问实际数据(HDFS)下面我们将用一个关于NBA球员分析的数据进行区别内部表和外部表。创建内部表t1-- 创建有一个内部表t1dr
2022-02-13 23:55:23 7235
原创 Hive安装与启动
下载地址(3.1.2版本):https://dlcdn.apache.org/hive/hive-3.1.2/配置环境变量我自己的环境变量在:/etc/profile.d/my_env.sh内嵌模式解决Hadoop和hive之间guava的版本差异删除hive-3.1.2/lib/guava-19.0.jar将hadoop-3.1.3/share/hadoop/common/lib/guava-27.0-jre.jar复制到hive-3.1.2/lib/目录下修改hive环.
2021-11-15 21:44:09 2645
原创 HDFS常用Shell命令
大多数HDFS Shell命令的行为和对应的Unix Shell命令类似,主要不同之处是HDFS Shell命令操作的是远程Hadoop服务器的文件,而Unix Shell命令操作的是本地文件。HDFS Shell开头式可以是hadoop fs或者hdfs -dfs。HDFS帮助命令-help:显示命令的帮助信息HDFS文件操作命令-mkdir:创建文件夹-ls:显示当前目录下所有文件-du-count-touchz-mv-cp-rm-put..
2021-11-06 00:58:44 3440 3
原创 MapReduce-处理需求NBA球员数据(Hadoop)
目录基于本地模式测试数据需求定义Map类定义Reduce类自定义输出类型类并且进行排序定义分区类Partitioner定义Driver/main类(驱动)数据结果基于Hadoop集群测试jar包导出并且上传到集群运行jar包(在这之前先将数据上传到HDFS)数据结果基于本地模式测试数据需求MapReduce是一种并行编程模型,用于大规模数据集的并行运算。数据格式:球员-位置-身高-体重-年龄-球龄-出场次数-场均时间-进攻能力-防守能力-.
2021-11-03 20:46:48 3599 5
原创 腾讯云TDSQL数据库交付运维初级工程师-腾讯云CloudLite认证(TCA)考试部分试题
1 . 关于TDSQL(MySQL版)备份恢复说法正确的是?CA . 只支持物理备份B . 只支持逻辑备份C . 支持物理和逻辑以及增量备份D . 支持物理备份但是无法实现增量备份2 . 下列哪个属于关系型数据库? AA . TDSQL(MySQL版)B . RedisC . HbaseD . MongoDB3 . 下列关于数据库用户权限设计描述错误的是?CA . 除核心维护人员外,其他用户不能拥有SUPER权限账号B . TDSQL(MySQL版)的权限支.
2021-10-29 21:04:33 6315 4
原创 Session和Cookie的区别
前言在学校里,学生进入学校需要学生证(如果是第一次进入学校,就会给你制作一个学生证,也就是会给你创建一个cookie),这里的学生证相当于一个cookie,当然,cookie可以有多个,保安(服务器)看到你有学生证,就允许你进入学校。如果你不想通过学生证这些东西(cookie)来进入学校,你可以通过登记信息(session),保安会将你记录下来(会有一个sessionID,用户唯一),这样你以后想要进入学校就可以通过登记的信息(sessionID)来进入学校。共同点cookie和sessio
2021-10-25 22:03:26 145
原创 Python数据可视化神奇利器,Pyecharts的使用(4.雷达图的使用之FIFA足球明星分析)
前面安装步骤以及大致使用在主页柱状图的使用那篇文章中,可以点击主页进行访问!FIFA22球星前五雷达图展示数据清洗import numpy as npimport pandas as pdfrom pyecharts import options as optsfrom pyecharts.charts import Radarfrom pyecharts.globals import ThemeType#导包data = pd.read_csv(r'C:\Use...
2021-10-11 14:25:06 832 2
原创 Python数据可视化神器利器,Pyecharts的使用(3.树图的使用)
简单使用 前面安装的步骤以及大致使用在主页柱状图的使用那篇文章中,可以点击主页进行访问!
2021-09-25 18:49:21 1154 1
原创 Python数据可视化神奇利器,Pyecharts的使用(2.饼图使用之分析世界五百强数据可视化)
简单使用前面安装步骤以及大致使用在主页柱状图的使用,可以点击主页进行查找!import pandas as pdfrom pyecharts import options as optsfrom pyecharts import Piecountry=['中国','日本','美国','俄罗斯','韩国']num=[123,24,88,76,13]#这里是随便伪造的数据pie=( Pie() #Pie(init_opts=opts.InitOpts(...
2021-09-18 22:00:38 1211 6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人