自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 学习笔记-机器学习KNN算法实践

机器学习,KNN算法,人工智能

2022-05-22 15:00:06 299

原创 2022字节跳动【数据仓库工程师】日常实习面经-----一面

字节跳动【数据仓库工程师】日常面经

2022-05-14 23:18:17 1253 2

原创 学习笔记-大数据之路-数据模型篇-数据整合及管理体系-模型实施

学习笔记-大数据之路-数据模型篇-数据整合及管理体系-模型实施

2022-05-01 21:16:58 1329

原创 学习笔记-大数据之路-数据模型篇-数据整合及管理体系-模型设计

阿里巴巴大数据模型构建之模型设计

2022-04-30 22:41:36 1221

原创 报错-hive on spark执行数据导入脚本报错

FAILED: SemanticException Failed to get a spark session: org.apache.hadoop.hive.ql.metadata.HiveException: Failed to create Spark client due to invalid resource request: Required executor memory (2048), overhead (384 MB), and PySpark memory (0 MB) is above

2022-04-15 16:53:16 2583

原创 学习笔记-大数据之路-数据模型篇-数据整合及管理体系-规范定义

阿里巴巴大数据模型构建之规范定义

2022-04-12 23:30:09 2151

原创 报错- Hadoop下core-site配置压缩参数后测试失败

java.lang.IllegalArgumentException: Compression codec org.apache.hadoop.io.compress.GzipCodec not found.Caused by: java.lang.ClassNotFoundException: Class org.apache.hadoop.io.compress.GzipCodec not found

2022-04-11 21:28:42 1250

原创 报错- Hadoop集群启动后DataNode消失一个

ERROR org.apache.hadoop.hdfs.StateChange: BLOCK* NameSystem.getDatanode: D ata node DatanodeRegistration(192.168.10.102:9866, datanodeUuid=55173a5c-2022-4da1-88e7-6f951a5d07 1d, infoPort=9864, infoSecurePort=0, ipcPort=9867, storageInfo=lv=-57;

2022-04-11 21:19:03 2241

原创 学习笔记-大数据之路-数据模型篇-建模综述

第8章 大数据领域建模综述8.1,为什么需要数据建模  数据爆发增长,如何将这些数据进行有序、有结构地分类组织和存储(数据太多了,怎么办才能将数据放规矩点,方便后续查找,不要到处散乱)  数据模型建立后好处:性能 :良好的数据模型能帮助我们快速查询所需要的数据,减少数据的I/O吞吐。 (查询速度快)成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用,极大地降低大数据系统中的存储和计算成本。 (降本增效)效率 :良好的数据模型能极大地改善用户使用数据的体验,提高使用数据的效

2022-04-04 15:09:59 1532

原创 学习笔记-Spark运行架构概述

学习笔记-大数据spark运行架构的概述

2022-04-03 12:25:24 573 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除