大数据Spark
文章平均质量分 73
Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
严同学正在努力
正在努力的程序猿,最优秀的IT农民工
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
TiDB:深度解析 NewSQL 分布式数据库架构、特性与应用场景
OLTP、OLAP、分布式、向量数据都给你包含了原创 2025-12-27 13:00:59 · 762 阅读 · 0 评论 -
面试真题-数据治理工程师
前面找到了一个数据治理的面试,简单问几个问题,不太熟练,现在回来加深一下印象原创 2025-11-10 07:00:00 · 1258 阅读 · 0 评论 -
解决Plugin PluginIdentifier{engineType=‘seatunnel‘, pluginType=‘source‘, pluginName=‘MySQL-CDC‘}
在海豚dolphinschedueler中配置了一个seatunnel实时增量同步脚本,遇到没有mysql-cdc插件包问题原创 2025-09-16 21:40:11 · 559 阅读 · 0 评论 -
数据开发工作了一年,准备跳槽,回顾一些面试常见问题,大数据面试题汇总与答案分享
这里给大家总结一些常见的面试题,我自己也能温故知新一下,包括Hadoop、Hive、Spark、Flink、HBase、Kafka、Zookeeper等。原创 2025-09-02 15:55:16 · 1086 阅读 · 0 评论 -
转行数据分析师,愿望是进大厂
今天我找到了一些数据分析的常见面试题,按我的见识回答一下这些面试题,如有错误请大佬指正,谢谢!原创 2025-06-07 15:02:16 · 959 阅读 · 0 评论 -
深入探索数据治理未来:DeepSeek智能数据整体方案解析
DeepSeek智能数据治理整体方案以其创新性和实用性脱颖而出,为企业提供了一种全新的数据管理思路原创 2025-03-06 07:30:00 · 1517 阅读 · 0 评论 -
数据治理,到底治的是什么?理的是什么?
我要学数据治理,大佬请赐教原创 2025-02-19 23:23:33 · 1053 阅读 · 0 评论 -
我跟着AI写数仓设计,他的表现绝了,超乎我的想象!
用AI帮我设计了一个电商数仓系统。不得不服原创 2025-02-16 15:40:28 · 1414 阅读 · 0 评论 -
数据人,需要了解的数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据
一文略讲数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据原创 2024-07-14 08:00:00 · 2093 阅读 · 0 评论 -
finalshell刚连上就断,这个参数你注意到了吗
finalsshell点击连接,刚连接上就断开,这把我气的啊,后面检查才发现是我的参数不正确导致的。轻轻松松解决,下班原创 2024-06-05 20:49:19 · 4074 阅读 · 0 评论 -
HBase 常用 shell 操作
得了,今天就学点hbase吧。下班,溜溜球。原创 2024-06-01 07:45:00 · 872 阅读 · 0 评论 -
认识数仓拉链表
本文将详细介绍拉链表的概念、应用、优缺点以及实现方法,帮助读者更好地理解和掌握数据仓库中的拉链表技术。原创 2023-12-20 19:18:48 · 677 阅读 · 0 评论 -
免费玩云上大数据--海汼部落实验室
电脑配置不行了吧?虚拟机跑不动了吧?内存不足了吧?原创 2023-09-23 13:37:07 · 427 阅读 · 0 评论 -
大数据项目连接工具类JDBCUtil、HBaseUtil、MyKafkaUtil、SparkUtil,四大工具类代码分享
代码重用、模块化、降低耦合度、提高可读性和可理解性、便于测试和调试,提高开发效率。原创 2023-08-04 15:13:13 · 604 阅读 · 0 评论 -
hive初始化元数据库时报错:Exception in thread “main“ java.lang.NoSuchMethodError: com.google.common.base.
解决hive初始化元数据库时报错原创 2023-07-06 16:24:00 · 1428 阅读 · 2 评论 -
好处多多的数仓分层是怎么样子的呢?如何创建数仓分层,
数仓中的ODS、DIM、DWD、DWS、ODS是干什么的,怎样创建数仓分层和模型构建原创 2023-07-01 12:48:54 · 314 阅读 · 0 评论 -
MySQL安装和初始化全流程
MySQL安装和初始化全流程,Linux和Windows安装原创 2023-06-30 22:57:29 · 4128 阅读 · 0 评论 -
面试大数据方向必问的问题:HDFS的读写流程
HDFS的读写流程,详细读写流程,面试必须通过。原创 2023-06-23 20:30:02 · 437 阅读 · 0 评论 -
解决报错:ava.sql.BatchUpdateException: Data truncation: Incorrect datetime value: ‘1525-07-08 22:33:20‘
检查表结构和数据类型,检查数据格式,使用正确的字符集,调整表结构,按步骤来检查原创 2023-05-12 11:34:29 · 4326 阅读 · 0 评论 -
ERROR: KeeperErrorCode = NoNode for /hbase/master,hbase在shell命令行中查看表时报错解决方案
hadoop上文件与本地文件不一致,所以进入hbase时list搜索不到之前的一整个文件原创 2023-04-30 11:58:47 · 4829 阅读 · 1 评论 -
在hbase中查看表,报错org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet
别急一杯了☕的时间就能解决,轻松解决报错Hadoop进入安全模式原创 2023-04-29 22:21:44 · 400 阅读 · 0 评论 -
Spark运行架构
运行架构、核心组件、核心概念通通说清楚,图文并茂。。原创 2023-04-19 10:42:31 · 403 阅读 · 0 评论
分享