![](https://img-blog.csdnimg.cn/20210907151307864.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
开发/运维应知应会IT基础知识
文章平均质量分 91
IT开发人员,应该了解或者掌握的计算机基础知识。或了解,或重点掌握。
涤生大数据
在职阿里,美团,京东,字节大数据技术专家,擅长大数据开发,集群架构/运维,爱好python数据分析/爬虫,欢迎一起交流
展开
-
涤生大数据实战:基于Flink+ODPS历史累计计算项目分析与优化(上)
当一个用户在T日实时上传了自己的跑步记录,Flink节点1会计算出其 [当日0点起至此刻] 的跑步累计数据data1,Flink节点2会根据该用户id取hbase维表里查询其 [历史~T-1日] 的累计数据 data2 (hbase表里数据由odps每日更新,即T-1日的存量累计汇总数据),将data1和data2二者汇总,就可得到 用户历史至此时刻的汇总数据;在凌晨时分,ODPS计算T-1日数据期间,如果发生了对T-1日的数据查询,则无法获取到期望的T-1日数据,会继续使用T-2日的数据。原创 2024-02-05 12:08:37 · 1505 阅读 · 0 评论 -
大数据实战:Ambari开发手册之OpenTSDB快速集成技巧
用于描述这个服务,服务的组件和管理脚本用于执行命令。一个组件的服务可以是MASTER,SLAVE或CLIENT类别。这个<category>告诉Ambari默认命令应该用于管理和监控组件。为每个组件指定<commandScript >执行命令时使用。有一个默认命令定义组件必须支持。原创 2024-02-01 16:30:00 · 980 阅读 · 0 评论 -
Flink:快速掌握批处理数据源的创建方法
本文收集了实现领域的反馈,因为javadoc无法涵盖高性能和可维护源的所有实现细节。希望你喜欢这篇文章,并且它给了你为Flink项目贡献一个新连接器的愿望!Flink:快速掌握批处理数据源的创建方法。原创 2024-01-25 07:15:00 · 988 阅读 · 0 评论 -
大数据平台实践之CDH6.2.1+spark3.3.0+kyuubi-1.6.0
前言:关于kyuubi的原理和功能这里不做详细的介绍,感兴趣的同学可以直通官网:https://kyuubi.readthedocs.io/en/v1.7.1-rc0/index.html。原创 2023-11-22 15:30:00 · 373 阅读 · 0 评论 -
还不知道Java类加载机制,你算白学了
当一个符合Java虚拟机规范的字节流文件,经历 加载、验证、准备、解析、初始化这些阶段相互协作执行完成之后,加载阶段读取到的Class字节流信息,会按虚拟机规定的格式,在方法区保存一份,然后Java 堆中,会创建一个 java.lang.Class 类的对象,这个对象描述了这个类所有信息,也提供了这个类在方法区的访问入口。原创 2023-08-09 14:34:22 · 208 阅读 · 0 评论 -
大数据开发面试必问:Hive调优技巧系列一
Hive SQL 几乎是每一位互联网分析师的必备技能,相信很多小伙伴都有被面试官问到 Hive 优化问题的经历。所以掌握扎实的 HQL 基础尤为重要,hive优化也是小伙伴应该掌握的一项技能,本篇文章具体从hive建表优化、HQL语法优化、数据倾斜优化、hivejob优化四个大块讲解,带你系统的了解hive优化。原创 2023-07-31 11:10:32 · 450 阅读 · 0 评论 -
企业大数据可视化案例专题分享-入门
架构位置:如下图所示,是一个比较典型的数据架构图,它分为三大块:数据源、数据ETL模块、数据应用模块。那这里的报表应用就属于可视化的部分,通常它是以定制化的数据看板呈现业务数据,或者按照自己需求进行控件(例如饼图、柱状图、折线图等)拖拽呈现。步骤4:添加其他步骤。重复步骤二和步骤三,为漏斗添加其他步骤,形成完整行为漏斗。若想分析广东省地区的用户购买行为,首先点击“创建漏斗”按钮,并将漏斗名称命名为“电商转化漏斗”。步骤3:点击“触发限制条件”按钮,添加筛选条件,在下拉选单中选择“省份”等于“广东省”。原创 2023-08-03 21:53:45 · 404 阅读 · 0 评论 -
企业数据治理实战总结--数仓面试必备
任何事物都具有一定的生命周期,数据也不例外。从数据的产生、加工、使用乃至消亡都应该有一个科学的管理办法,将极少或者不再使用的数据从系统中剥离出来,并通过核实的存储设备进行保留,不仅能够提高系统的运行效率,更好的服务客户,还能大幅度减少因为数据长期保存带来的储存成本。常见的业务元数据有维度及属性(包括维度编码,字段类型,创建人,创建时间,状态等)、业务过程、指标(包含指标名称,指标编码,业务口径,指标类型,责任人,创建时间,状态,sql等),安全等级,计算逻辑等的规范化定义,用于更好地管理和使用数据。原创 2023-07-18 11:11:19 · 1200 阅读 · 0 评论 -
linux查找命令,文件就这些which,whereis,locate,find,grep,|
linux生产中我们经常需要查看某个软件是否安装,某个文件在哪里等,某个命令是否存在等。1.which查看可执行文件的位置which命令的作用是,在PATH变量指定的路径中,搜索某个系统命令的位置,并且返回第一个搜索结果,查询命令和可执行文件,而且是PATH里的。也就是说,使用which命令,就可以看到某个系统命令是否存在,以及执行的到底是哪一个位置的命令。which ls。2 .whereis查找程序whereis只可以查找命令,(man中说只能查命令、源文件和man文件,实际测...原创 2021-11-12 17:30:04 · 2770 阅读 · 5 评论 -
Linux 磁盘管理详解--企业实战篇
写在前面: 无论是windows 系统还是Linux 系统中,所有的文件最终都是存储在硬盘上的,都是在用文件系统管理,要想彻底搞清楚文件系统的管理机制,对磁盘的了解是必不可少的。一、磁盘的认识磁盘的分类如果从存储数据的介质上来区分,硬盘可分为机械硬盘(Hard Disk Drive, HDD)和固态硬盘(Solid State Disk, SSD),机械硬盘采用磁性碟片来存储数据,而固态硬盘通过闪存颗粒来存储数据。机械硬盘(HDD)机械硬盘(HD...原创 2021-09-14 15:45:53 · 3272 阅读 · 12 评论 -
超网合并详解
一、超网的概念超网(Supernetting)是与子网类似的概念,IP地址根据子网掩码被分为独立的网络地址和主机地址。超网,也称无类别域间路由选择(CIDR),它是集合多个同类互联网地址的一种方法。与子网划分(把大网络分成若干小网络)相反,它是把一些小网络组合成一个大网络,就是超网。二、超网合并网段1、合并网段示例:某企业有一个网段,该网段有200台主机,使用192.168.0...转载 2018-09-18 18:12:52 · 13849 阅读 · 5 评论 -
网络通信预备篇:进制计数
只要记住你的名字,不管你在世界的哪个地方,我一定会去见你。 ——电影《你的名字》在我们的日常生活中,每个人的名字对应一个唯一的身(敏)份(感)证(词)号,在Internet上也是一样,每台主机(Host),包括所有的具有上网功能的电子设备都有IP地址,有了IP地址,这些电子设备联...转载 2018-09-18 16:55:35 · 10661 阅读 · 0 评论 -
子网划分详解
1、为什么要划分子网?IPv4地址如果只使用有类(A、B、C类)来划分,会造成大量的浪费或者不够用,为了解决这个问题,可以在有类网络的基础上,通过对IP地址的主机号进行再划分,把一部分划入网络号,就能划分各种类型大小的网络了。2、IPv4子网划分与聚合为了解决IPv4的不足,提高网络划分的灵活性,诞生了两种非常重要的技术,那就是VLSM(可变长子网掩码)和CIDR(无类别域间路由),把...转载 2018-09-18 18:11:27 · 85274 阅读 · 24 评论 -
子网掩码使用详解
一、子网掩码IP地址是以网络号和主机号来标示网络上的主机的,我们把网络号相同的主机称之为本地网络,网络号不相同的主机称之为远程网络主机,本地网络中的主机可以直接相互通信;远程网络中的主机要相互通信必须通过本地网关(Gateway)来传递转发数据。1、子网掩码的概念及作用①、子网掩码(Subnet Mask)又叫网络掩码、地址掩码,必须结合IP地址一起对应使用。②、只有通过子网掩码...转载 2018-09-18 17:57:42 · 53543 阅读 · 6 评论 -
IP地址使用,分类等详解
目录一、IP地址和MAC地址二、IP地址的分类三、保留的特殊IP地址四、公网和私网IP地址一、IP地址和MAC地址1、MAC地址MAC(Media Access Control,介质访问控制)地址,或称为物理地址,也叫硬件地址,用来定义网络设备的位置,MAC地址是网卡出厂时设定的,是固定的(但可以通过在设备管理器中或注册表等方式修改,同一网段内的MAC地址必须唯一)。M...转载 2018-09-18 17:28:36 · 23357 阅读 · 2 评论 -
网络通信原理:为什么一个IP账号通过路由器可供多人同时使用?
学习过ip中的人都知道,ip的作用就是在网络通信中标识唯一一台主机。那么实际中,你购买了一个账号,运行商给你分配一个ip,通过路由器为什么就可以供多人(多台电脑)同时使用呢?这个时候不就和前面矛盾了吗?1.让两台电脑之间通信:网线想让两台电脑之间通信,最简单的方式就是用一根网线连接双方即可。进行如下的配置:如果两台电脑之间通过网线连接是可以直接通信的,但是需要提前...原创 2019-07-11 21:11:24 · 15334 阅读 · 10 评论