- 博客(193)
- 资源 (3)
- 收藏
- 关注
原创 线性代数(二) 矩阵及其运算
行列式det(A) 其实表示的只是一个值∣abcd∣ad−bca & b\\acbdad−bc,其基本变化是基于这个值是不变。而矩阵表示的是一个数表。矩阵与线性变换的关系即得a11a12a1na21a22a2nam1am2amnx1x2xny1y2yna11a21...am1a12a22...am2...
2023-08-07 20:10:20
1710
原创 Gitlab CI/CD概述
CI/CD 是一种持续开发软件的方法,可以不断的进行构建、测试和部署代码迭代更改。这种迭代有助于减少基于错误或失败的版本进行开发新代码的可能性。使用这种方法,从新代码开发到部署,可以减少人工干预甚至不用干预。持续集成持续交付持续部署。
2023-06-12 23:31:39
1766
原创 Linux rootfs
rootfs 是文件系统的根目录,其包含了操作系统所需的所有文件和目录,包括程序、库文件、配置文件、设备文件等,它是系统启动时必须加载的文件系统之一。
2023-05-23 17:08:41
665
1
原创 Linux cgroup
Cgroup和namespace类似,也是将进程进程分组,但是目的与namespace不一样,namespace是为了隔离进程组之前的资源,而Cgroup是为了对一组进程进行统一的资源监控和限制。
2023-05-07 17:40:43
563
原创 initrd&init进程
initrd的全名是init ramdisk,是一个启动时存在于内存的文件系统。init是Linux的第一个进程
2023-03-26 17:12:37
1619
1
原创 数据湖-hudi概述
数据湖是一个集中式存储库,允许您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析 – 从控制面板和可视化到大数据处理、实时分析和机器学习,以指导做出更好的决策。
2022-10-12 15:37:02
16178
1
原创 Spark概述
MR计算模型已经可以满足所有的计算需求了。但其对于一些复杂的计算要经过多个Map或者reduce, 中间步骤读写HDFS。而这些中间数据是不被用户关心的,spark提出RDD计算模型, 不同于MR的是中间输出结果可以保存在内存中。...
2022-05-31 18:03:11
253
原创 Hbase概述
HBase是一个分布式、可扩展、支持海量数据存储的NoSQL数据库。底层物理存储是以Key-Value的数据格式存储的,HBase中的所有数据文件(默认)都存储在Hadoop HDFS文件系统上。
2022-05-14 21:56:08
953
原创 hadoop yarn调度平台
YARN 是 Hadoop 资源管理器。负责协调任务作业的服务器资源。使任务有序对资源进行利用。除了支持原生 MapReduce任务,他还提供了Spark等任务接入的入口。
2022-05-08 22:50:23
990
原创 Hadoop HDFS概述
在现代的企业环境中,单机容量往往无法存储大量数据,需要跨机器存储。统一管理分布在集群上的文件系统称为分布式文件系统。
2022-04-26 18:50:33
1152
原创 clickhouse概述
随着数据科技的进步,数据分析师早已不再满足于传统的T+1式报表或需要提前设置好维度与指标的OLAP查询。数据分析师更希望使用可以支持任意指标、任意维度并秒级给出反馈的大数据Ad-hoc查询系统。这对大数据技术来说是一项非常大的挑战,传统的大数据查询引擎根本无法做到这一点。由俄罗斯的Yandex公司开源的ClickHouse脱颖而出。在第一届易观OLAP大赛中,在用户行为分析转化漏斗场景里,ClickHouse比Spark快了近10倍。
2022-03-28 20:15:32
2894
1
原创 任务调度框架quartz
Quartz是OpenSymphony开源组织在Job scheduling领域又一个开源项目,完全由Java开发,可以用来执行定时任务,类似于java.util.Timer。但是相较于Timer, Quartz增加了很多功能。
2022-03-13 19:41:46
1312
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人