自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(194)
  • 收藏
  • 关注

原创 最全秋招面试题系列- - -Java工程师(七)_java工程师秋招,薪资翻倍

当整个 zookeeper集群刚刚启动或者 Leader服务器宕机、重启或者网络故障导致不存在过半的服务器与 Leader服务器保持正常通信时,所有进程(服务器)进入崩溃恢复模式,首先选举产生新的 Leader服务器,然后集群中 Follower服务器开始与新的 Leader服务器进行数据同步,当集群中超过半数机器与该 Leader服务器完成数据同步之后,退出恢复模式进入消息广播模式,Leader服务器开始接收客户端的事务请求生成事物提案来进行事务请求处理。

2024-05-16 05:15:33 289

原创 最全硬件知识:打印机十个共性故障解决方法_打印电缆过长如何解决(1),2024年最新学习大数据开发开发的步骤,

先调节一下打印头与打印辊间的间距,故障不能排除,可以换新色带。如果是打印头断针或是驱动电路问题,就只能更换打印针或驱动管了可以换新墨盒或注墨水,如果墨盒未用完,可以断定是喷嘴堵塞:取下墨盒(对于墨盒喷嘴不是一体的打印机,需要取下喷嘴),把喷嘴放在温水中浸泡一会儿,注意一定不要把电路板部分浸在水中,否则后果不堪设想。原因:大多是色带油墨干涸、打印头断针、推杆位置调得过远.解决方法:更换色带和调节推杆。

2024-05-16 05:15:00 676

原创 最全真实大数据简历模版(二)【大数据-3年经验】金融_大数据 简历,2024年最新阿里P7级别面试经验总结

为了提高产品服务质量,满足客户的个性化需求,给客户针对性推荐有价值的产品信息,现需将每位客户的需求更加细化、精准化,通过收集用户的信息与浏览行为习惯,为每个用户打上标签构建专属用户画像,针对性匹配金融产品,帮助客户发现真正有帮助,有价值的信息,节省客户的浏览时间,快速了解类似产品和资讯的速度,缩短成交周期。5.通过构建匹配、统计、挖掘模型,把用户的学历、职业、商圈、消费能力、商品偏好、房产、车产等用户属性与标签进行合并,最终产生的用户标签数据,保存到Hbase中;

2024-05-16 05:14:27 834

原创 最全百度T7大牛强烈推荐学习的230页Elasticsearch大数据搜索引擎,熬了整整30天

默认Elasticsearch是使用Netty作为HTTP的容器的,由于Netty并没有权限模块,所以默认Es没有任何的权限控制,直接通过HTTP就可以进行任何操作,除非把HTTP禁用。目前Elasticsearch是实时系统监控的首选,第9章介绍了使用Elasticsearch 监控与分析日志,也介绍了通过物联网监控系统的方案。这里首先介绍一种理解语义的方法,然后介绍数据深度整合的方法,以便能够得到更好的答案。这里首先介绍采用JSP和自定义标签实现的搜索界面,然后介绍REST架构的搜索界面。

2024-05-16 05:13:54 822

原创 大数据最新大数据面试,35岁以上程序员求职没市场

内存计算:mapreduce在编程模型上,只有简单map和reduce,而且map阶段的所以数据都要写入到磁盘,导致磁盘io开销很大,速度也很慢,而spark是完全基于内存的计算框架,只有当内存溢出的时候,才会写入到磁盘,这减少了磁盘读写操作,提高了计算效率。在早期spark还没有出现的时候,是没人觉得mapreduce慢的,直到spark的出现,让众多大数据开发人员眼前一亮,经过统计,某些情况下,spark的处理效率要比mapreduce快100倍。所以在内存有限的情况下,不推荐使用。

2024-05-15 20:27:44 353

原创 大数据最新大数据面试题_kafka message header,2024年最新看完这篇

大家都知道namenode与secondary namenode 的关系,当他们要进行数据同步时叫做checkpoint时就用到了fsimage与edit,fsimage是保存最新的元数据的信息,当fsimage数据到一定的大小事会去生成一个新的文件来保存元数据的信息,这个新的文件就是edit,edit会回滚最新的数据。5、client请求3台dn中的一台A上传数据(本质上是一个RPC调用,建立pipeline),A收到请求会继续调用B,然后B调用C,将真个pipeline建立完成,逐级返回客户端。

2024-05-15 20:27:11 251

原创 大数据最新大数据面试专题 -- kafka(1),再不刷题就晚了

topic:一个topic是kafka集群中数据流中的列别,存储数据partition:一个topic可以分成多个分区。replica:副本,实现kafka集群的容错consumer group:消费者组,对于同一个消费者中的消费者可以消费同一个topicoffset:偏移量,对于消费者和partition来说,可以通过offset进行拉取数据。

2024-05-15 20:26:38 216

原创 大数据最新大数据面试(1),2024年最新熬夜整理大数据开发面试笔试题

因为外部表真正的执行不在数据库引擎中,像一些删除操作、修改操作都是不太好支持的,所以还是具有一定的局限性。目前除了hive,还有clickhouse、doris、starrocks等等工具都支持外部表功能。

2024-05-15 20:26:04 310

原创 基于Echarts构建大数据招聘岗位数据可视化大屏_基于echart高校教师队伍大数据页面(1)

本次项目是使用Echarts构建大数据招聘岗位信息可视化大屏,使用到的技术为前端三剑客(html、css、javascript)。

2024-05-15 09:34:30 402

原创 基于Echarts+HTML5可视化数据大屏展示—运营大数据平台_html5图表框架echarts实战项目(50套源码),大数据平台展示可视化效果

``作品来自于网络收集、侵权立删。

2024-05-15 09:33:54 325

原创 基于Echarts+HTML5可视化数据大屏展示—运营大数据平台_html5图表框架echarts实战项目(50套源码),大数据平台展示可视化效果(2)

【代码】基于Echarts+HTML5可视化数据大屏展示—运营大数据平台_html5图表框架echarts实战项目(50套源码),大数据平台展示可视化效果(2)

2024-05-15 09:33:19 434

原创 基于Echarts+HTML5可视化数据大屏展示—运营大数据平台_html5图表框架echarts实战项目(50套源码),大数据平台展示可视化效果(1)

【代码】基于Echarts+HTML5可视化数据大屏展示—运营大数据平台_html5图表框架echarts实战项目(50套源码),大数据平台展示可视化效果(1)

2024-05-15 09:32:41 383

原创 【Web前端面试】葵花宝典(2024版本)——HTTP 浏览器 篇_葵花宝典浏览器网站(1)

本篇文章主要写的是【前端高频面试题(HTTP/浏览器)篇】,本来不打算更新本篇文章了,但是经验所得面试问到的有关HTTP、浏览器等前端基础问题还是不少,所以本文总结一写常见的分享给各位。【Web前端面试】葵花宝典(2022版本)—— Vue篇【Web前端面试】葵花宝典(2022版本) —— React 篇【Web前端面试】葵花宝典(2022版本)—— CSS篇【Web前端面试】葵花宝典 (2022版本)—— JS篇(上)【Web前端面试】葵花宝典(2022版本)—— JS篇(下)

2024-05-15 00:56:09 776

原创 【Typescript】学习笔记(三)之接口与泛型的使用_接口定义泛型函数

/但是有同时满足是一个number又是一个string的值吗?(img-QePhBDZS-1715705710549)](img-AowioJvy-1715705710549)](img-a6Pam2JA-1715705710549)]// xxx: 12 // error 没有在接口中定义, 不能有。//表达的含义是number和string要同时满足;// sex: ‘男’ // 可以没有。// sex: ‘男’ // 可以没有。// 一个类可以实现多个接口。

2024-05-15 00:55:33 594

原创 【Typescript】学习笔记(三)之接口与泛型的使用_接口定义泛型函数(1)

最简单判断该用readonly还是const的方法是看要把它做为变量使用还是做为一个属性。做为变量使用的话用const,若做为属性则使用readonly。

2024-05-15 00:54:57 275

原创 【Typescript】学习笔记(一)之基础类型_typegoose typegoose 学习

这里是小飞侠Pan🥳,立志成为一名优秀的前端程序媛!!!本篇博客收录于我的github前端笔记仓库中,持续更新中,欢迎star~👉。

2024-05-15 00:54:21 754

原创 Flink 内容分享(一):Fink原理、实战与性能优化(一)_flink原理、实战与性能优化(2)

大数据(Big Data)是指规模庞大、结构多样且速度快速增长的数据集合。这些数据集合通常包含传统数据库管理系统无法有效处理的数据,具有高度的复杂性和挑战性。三V,即Volume(数据量大)、Variety(数据多样性)、Velocity(数据速度)。数据量大(Volume):大数据的最明显特征之一是其庞大的数据量。传统的数据处理方法和工具在处理这种规模的数据时可能会变得低效或不可行。数据多样性(Variety)

2024-05-14 15:33:30 718

原创 Flink 内容分享(一):Fink原理、实战与性能优化(一)_flink原理、实战与性能优化(1)

Flink程序开发的流程总结如下:1)获得一个执行环境2)加载/创建初始化数据3)指定数据操作的算子4)指定结果数据存放位置5)调用execute()触发执行程序注意:Flink程序是延迟计算的,只有最后调用execute()方法的时候才会真正触发执行程序。

2024-05-14 15:32:54 872

原创 ElasticSearch集群内存占用高?如何降低内存占用看这篇文章就够啦!(冻结索引)_es占用内存太大

冻结索引示例。

2024-05-14 15:32:18 597

原创 ElasticSearch集群内存占用高?如何降低内存占用看这篇文章就够啦!(冻结索引)_es占用内存太大(1)

在上述代码中,我们首先创建了一个 SearchRequest 对象,然后使用 IndicesOptions.fromOptions() 方法创建了一个 IndicesOptions 对象,并将参数设置为 false。这样,搜索请求将遵循指定的索引选项,而不使用默认的 ignoreThrottled 参数值。要设置 ignoreThrottled 参数为 false,您可以使用 IndicesOptions.fromOptions() 方法并传递适当的参数。

2024-05-14 15:31:41 820

原创 2024年最全大数据从业人员必要技能之Kafka,2024年最新阿里内部大数据开发笔记火爆IT圈

就拿数据量激增来说,Kafka能够有效隔离上下游业务,将上游突增的流量缓存起来,以平滑的方式传导到下游子系统中,避免了流量的不规则冲击。由于这些系统都是 为公司业务服务的 ,所以通常来说它们仅仅是执行一些常规的业务逻辑,因此它们 不能算是计算密集型应用,相反更应该是数据密集型的。2019年两会上再一次提到了要深化大数据、人工智能等领域应用的研发和发展,而Kafka无论是作为消息引擎还是实时流处理平台,都能在大数据工程领域发挥重要的作用。// key.deserializer 消息key序列化方式。

2024-05-14 06:55:24 608

原创 2024年最全大数据之Hadoop3简单入门(一)(通俗易懂)_hadoop3入门学习(2),2024年最新一起看看这些大厂面试真题查漏补缺吧

2.1.1 概念hadoop是一个分布式系统基础架构,主要解决数据存储与海量分析计算的问题,广泛来说,hadoop通常指的是Hadoop生态圈。2.1.2 hadoop优势主要分为4个方面。高可靠性:hadoop底层维护多个数据副本,即使当hadoop某个计算元素或存储出现故障,也不会导致数据丢失。高扩展性:集群间分配任务数据,可方便扩展数以千计的节点。就是动态的增加服务器的节点,保证每个节点正常运行,不会宕机。高效性:在MapReduce的思想下,hadoop是并行工作的。可以加快任务处理速度。

2024-05-14 06:54:48 964

原创 2024年最全大数据之Hadoop3(4),带你彻底弄明白

1)各个模块分开启动/停止(配置ssh是前提)常用1.整体启动/停止HDFS2.整体启动/停止YARN2)各个服务组件逐一启动/停止1.分别启动/停止HDFS组件2.启动/停止YARN。

2024-05-14 06:54:12 753

原创 2024年最全大数据之Hadoop3(3),2024年最新特殊渠道拿到阿里大厂面试真题

1)各个模块分开启动/停止(配置ssh是前提)常用1.整体启动/停止HDFS2.整体启动/停止YARN2)各个服务组件逐一启动/停止1.分别启动/停止HDFS组件2.启动/停止YARN。

2024-05-14 06:53:34 1002

原创 2024年大数据最新Docker 核心知识点 可视化仪表盘_containers apps(1),蚂蚁金服内推四面

视图列出了应用程序上运行的所有容器,并包含详细的日志视图。还可以启动、停止或删除应用程序。使用日志视图底部的搜索选项搜索应用程序日志以查找特定事件,或选择复制图标将日志复制到剪贴板。单击Visual Studio Code中的打开以在VS Code中打开应用程序。将鼠标悬停在容器列表上,以查看您可以执行的一些核心操作。

2024-05-13 22:07:11 763

原创 2024年大数据最新DirectX12(D3D12)基础教程(外篇三),2024年最新2024新一波程序员跳槽季

这个错误的提示,起初让我一脸懵逼,它提示的本意是说设置了光栅化阶段,但是后续的阶段并没有提供Position流变量,然后我想到的就是仔细检查了提供给ID3D12Device::CreateGraphicsPipelineState函数的所有参数,一个个比对,居然在同样参数的情况下,一个例子可以创建成功,另一个例子死活不行。

2024-05-13 22:06:35 372

原创 2024年大数据最新DirectX12(D3D12)基础教程(十七)(3),你的技术真的到天花板了吗

但要注意的是,并不总是这样。),最后用这个矩阵替代当前骨骼的变换矩阵,作为骨骼最终的变换矩阵。当前骨骼的最终世界空间变换矩阵计算出来后,首先存储到全局骨骼矩阵数组元素的成员中(stMeshData.m_arBoneDatas[nBoneIndex].m_mxFinalTransformation),接着就是循环递归遍历当前骨骼的子骨骼数组,并将这个矩阵作为子骨骼的父骨骼矩阵传入,因为所有骨骼的变换都是相对于自己的局部坐标系设定的,所以计算最终变换时,需要使用父骨骼的变换矩阵将自己变换到父骨骼的坐标空间中。

2024-05-13 22:05:59 536

原创 2024年大数据最新DenseNet实战:tensorflow2,2024年最新IBM大面积辞退40岁+的员工

第四步 定义图像处理的方法generator的主要作用是处理图像,并迭代的方式返回一个batch的图像以及对应的label。思路:在while循环:初始化input_samples和input_labels,连个list分别用来存放image和image对应的标签。分别从file_pathList和labels,得到图片的路径和对应的label读取图片如果是训练就增强resize图片将image转数组将图像和label分别放到input_samples和input_labels。

2024-05-13 22:05:22 948

原创 每天一道大厂SQL题【Day02】电商场景TopK统计_有50w个京东店铺,每个顾客访客访问任何一个店铺的任何一个商品时都会产生一条访问

4、数据量要小,工具要快,如果用hive,就设置set hive.exec.mode.local.auto=true;不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!,每个中间步骤都执行打印结果,看是否符合预期, 根据中间结果,进一步调整修饰SQL语句,再执行,直到接近结果表。参考答案适用HQL,SparkSQL,FlinkSQL,即大数据组件,其他SQL需自行修改。输出店铺名称、访客id、访问次数。

2024-05-12 19:10:19 464

原创 每天一道大厂SQL题【Day02】电商场景TopK统计_有50w个京东店铺,每个顾客访客访问任何一个店铺的任何一个商品时都会产生一条访问(1)

先通过 group by 按店铺名称进行分组,然后使用 count(distinct user_id) 计算每个店铺的访客数。先通过 group by 按店铺名称和用户id进行分组,然后使用 count(*) 计算每个用户在每个店铺的访问次数。参考答案适用HQL,SparkSQL,FlinkSQL,即大数据组件,其他SQL需自行修改。使用 order by 对访问次数进行排序,然后使用 limit 3 限制输出的数量。(2)每个店铺访问次数top3的访客信息。输出店铺名称、访客id、访问次数。

2024-05-12 19:09:43 286

原创 每天一道大厂SQL题【Day01】访问量统计_使用sql统计出每个用户的累积访问次数

要求使用SQL统计出每个用户的累积访问次数,如下表所示:用户id 月份 小计 累积如何实现?

2024-05-12 19:09:08 226

原创 每天一道大厂SQL题【Day01】访问量统计_使用sql统计出每个用户的累积访问次数(1)

我们有如下的用户访问数据要求使用SQL统计出每个用户的累积访问次数,如下表所示:用户id 月份 小计 累积如何实现?

2024-05-12 19:08:32 813

原创 最全计算机网络:电路、报文与分组交换_电路交换和分组交换 传送长度,2024年最新【架构师必备】

分组交换限制了每次传送的数据块大小的上限,把大的数据块划分为合理的小数据块,再加上一些必要的控制信息(如源地址、目的地址和编号信息等),构成分组(Packet)。网络结点根据控制信息把分组送到下一个结点,下一个结点接收到分组后,暂时保存并排队等待传输,然后根据分组控制信息选择它的下一个结点,直到到达目的结点。在进行数据传输前,两个结点之间必须先建立一条专用(双方独占)的物理通信路径(由通信双方之间的交换设备和链路逐段连接而成),该路径可能经过许多中间结点。并且后续会持续更新**

2024-05-12 10:38:40 405

原创 最全计算机网络:数据报与虚电路_虚电路控制信息,2024年最新带你全面掌握高级知识点

在分组发送之前,要求在发送方和接收方建立一条逻辑上相连的虚电路,并且连接一旦建立,就固定了虚电路所对应的物理路径。每条虚电路支持特定的两个端系统之间的数据传输,两个端系统之间也可以有多条虚电路为不同的进程服务,这些虚电路的实际路由可能相同也可能不同。在传送数据时,每个数据分组不仅要有分组号、校验和等控制信息,还要有它要通过的虚电路号,以区别于其他虚电路上的分组。在虚电路网络中的每个结点上都维持一张虚电路表,表中的每项记录了一个打开的虚电路的信息,包括在。虚电路方式试图将数据报方式与电路交换方式结合起来。

2024-05-12 10:38:04 334

原创 最全计算机网络:数据报与虚电路_虚电路控制信息(1),大厂面试必备

分组交换根据其通信子网向端点系统提供的服务,还可进一步分为面向连接的虚电路方式和无连接的数据报方式。。要注意数据报方式和虚电路方式是。

2024-05-12 10:37:28 258

原创 最全解密数仓的SQL ON ANYWHERE技术(3),大数据开发线程池面试题

​ 2)创建一个hdfs外表读取hdfs上的数据。

2024-05-12 10:36:52 381

原创 大数据最新技术学习:Python(02)|欲先善其事,必先利其器(基础知识,2024年最新不服不行

brew使用工具查询python的版本,根据需求安装即可。

2024-05-12 02:00:57 755 1

原创 大数据最新手把手做一个公众号GPT智能客服【一】准备工作_ai 客服 gpt(1),6年老大数据开发面经总结

随着人工智能技术的不断发展,自动问答系统(QA)在客户服务、技术支持等领域得到广泛应用。其中,基于OpenAI GPT等预训练语言模型的问答系统可以生成更加自然、准确的回答,受到了越来越多企业和个人的青睐。为了提高用户体验和效率,我们决定开发一个微信公众号机器人,该机器人可以根据用户发送的消息,通过调用OpenAI API进行聊天回复,并向用户推送相关内容。注:本篇文章主要以学习为主,介绍整体的流程在细节方面会有忽略。

2024-05-12 02:00:21 328

原创 大数据最新我发现了一款高效管理接口文档的神器_yapi eolink(2),2024年最新推荐给大家

结合 API 设计、文档管理、自动化测试、监控、研发管理和团队协作的一站式 API 生产平台,从个人开发者到跨国企业用户,Eolink 帮助全球超过30万开发者和数万家企业更快、更好且更安全地开发和使用 API。

2024-05-12 01:59:45 884

原创 大数据最新我发现了一款高效管理接口文档的神器_yapi eolink(1),大数据开发-App的设计架构经验谈

结合 API 设计、文档管理、自动化测试、监控、研发管理和团队协作的一站式 API 生产平台,从个人开发者到跨国企业用户,Eolink 帮助全球超过30万开发者和数万家企业更快、更好且更安全地开发和使用 API。

2024-05-12 01:59:09 407

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除