- 博客(8)
- 收藏
- 关注
原创 缓存之王--Redis
Redis是用C语言开发的一个开源的高性能键值对(key-value)数据库。它通过提供多种键值数据类型来适应不同场景下的存储需求,目前为止Redis支持的键值数据类型如下:- 字符串类型- 散列类型- 列表类型- 集合类型- 有序集合类型。
2024-09-12 20:16:17 415
原创 大数据面试题———SQL
这种方法在逻辑上更简单,但它可能在性能上不如窗口函数,特别是在处理大量数据时,因为自连接需要对数据进行多次扫描。:这种方法是最直观和最常用的,特别是在需要处理大量数据时,窗口函数可以有效地利用数据库的优化和并行处理能力。1、题目17:车辆每天上传N条数据,要求获得每日最后一条数据,请用至少三种方式写出来,并说明三种方式的区别。来为每个车辆每天的数据分配一个序号,其中序号为1的即为每天的最后一条数据。时间戳,然后通过子查询将这些时间戳与原表连接,以获取对应的记录。为每个分组内的记录分配一个唯一的序号。
2024-09-10 20:06:28 335
原创 Scala安装使用教程
Scala是一门多范式(multi-paradigm)的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行在Java虚拟机上,并兼容现有的Java程序。Scala源代码被编译成Java字节码,所以它可以运行于JVM之上,并可以调用现有的Java类库。函数编程范式更适合用于Map/Reduce和大数据模型,着眼于函数本身,函数范式逻辑清晰、简单,非常适合用于处理基于不变数据的批量处理工作。像Spark,kafka等都是采用Scala开发的,所以学习好大数据,掌握scala是必要的。
2024-09-10 07:00:00 1018
原创 搭建单机版dolphinscheduler时,连接mysql数据库报错
查阅资料后发现问题原因是:从特定IP地址连接到MySQL服务器时,由于多次连接失败,该IP地址已被MySQL服务器阻止。如果应用程序中存在连接泄漏,即创建了数据库连接但没有正确关闭,这可能导致过多的连接错误。:查看MySQL的错误日志文件,以确定是什么导致了多次连接错误。的值可能会降低服务器的安全性,因为它允许更多的失败连接尝试。的值被超过,这是一个MySQL配置参数,用于限制来自同一IP地址的失败连接尝试次数。这将设置新的阈值,允许更多的连接错误而不阻塞IP地址。这可以在MySQL配置文件(通常是。
2024-09-09 13:25:20 501
原创 大数据工具集--DataX
java 解决的是高并发问题,大数据解决的是海量数据存储与分析问题。大数据的各种工具集可以方便我们对海量数据进行存储与分析。
2024-09-08 22:57:28 1189
原创 DataX实战之MongoDB导入数据到mysql时报错
把maven版本改为apache-maven-3.6.1,删除之前加载的datax 源码,重新加载datax 源码就可以成功打包jar包。
2024-09-07 15:16:57 439
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人