自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(297)
  • 收藏
  • 关注

原创 ElasticSearch学习篇11_ANNS之基于图的NSW、HNSW算法

需要注意的是,k-means算法对初始聚类中心的选择敏感,可能会得到不同的结果。因此,可以多次运行算法,选择最优的结果。另外,k-means算法对于非凸形状的数据集效果可能不佳,此时可以考虑使用其他聚类算法。ps:凸形数据集:如果一个数据集D是凸的,简单来说,数据集D中任意两点的连线上的点,也会在数据集D内,那么数据集D就是一个凸集。简单的k-means代码demo。

2024-06-21 00:42:19 693

原创 IDEA的那些各种环境配置及实用插件_idea转配置文件插件

IDEA 全称 IntelliJ IDEA,是java编程语言开发的集成环境。IntelliJ在业界被公认为最好的java开发工具,尤其在智能代码助手、代码自动提示、重构、JavaEE支持、各类版本工具(git、svn等)、JUnit、CVS整合、代码分析、 创新的GUI设计等方面的功能可以说是超常的。IDEA是JetBrains公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。它的旗舰版本还支持HTML,CSS,PHP,MySQL,Python等。

2024-06-20 16:18:57 588

原创 docker快速部署hue+hue集成hive_hue docker(1)

查看搜索结果:Vim 会自动跳转到第一个匹配的结果处,如果需要查看其他搜索结果可以使用 n 键跳转到下一个匹配结果,使用 N 键跳转到上一个匹配结果。另外,还可以使用?进入搜索模式:使用 / 键进入搜索模式,光标会跳到屏幕的最底部,同时出现 / 字符。打开需要搜索的文件:在命令行中输入 vim 命令,可以打开指定的文件。在 Vim 中,可以使用 / 命令来进行搜索操作。输入要搜索的内容:在 / 后面输入要搜索的内容,并按下回车键。退出搜索模式:在搜索模式下,可以按下 ESC 键退出搜索模式。

2024-06-20 14:30:56 313

原创 CA证书与ETCD集群_根据证书查看etcd集群信息

mkdir k8scd k8setcd-cert.sh 是证书制作的脚本etcd.sh etcd启动脚本cat > ca-config.json

2024-06-20 11:46:02 439

原创 redis02——一篇终结redis的五种数据类型操作命令(可学习、复习、面试、收藏备用)

下标也可以是负数,表示列表从后往前取,-1表示倒数第一个元素,-2表示倒数第二个元素,以此类推;列表类型的数据操作总的思想是通过key和下标操作value,key是数据标识,下标是数据在列表中的位置,value是我们感兴趣的业务数据。集合类型的数据操作总的思想是通过key确定集合,key是集合标识,元素没有下标,只有直接操作业务数据和数据的个数。功能:将键值对field-value设置到哈希列表key中,如果key不存在,则新建哈希列表,然后执行赋值,如果key下的field已经存在,则value值覆盖。

2024-06-20 01:20:28 294

原创 IPV6大型网络配置实战_ipv6 组网 实战

本次集训营实验拓扑一共有三部分组成,其中总部的内网是双层架构,边界设备是一台防火墙;分支的内部架构相对而言简单一点,边界和总部一样,布置一台防火墙。不管是总部还是分部,内网都使用IPv6,第三个部分是运营商部分,因为一些原因运营商网络没有迁移到IPv6,内网全部都是IPv4。2️⃣要求总部内部的IPv6主机和分支内部的IPv6主机通过整个公网来互相访问。1️⃣要求总部、分部的IPv6主机可以访问运营商的IPv4服务器。

2024-06-20 00:17:04 1247

原创 37、一篇文章学习 Java 中的日期相关类(Date 和 Calendar),非常常用_java日期相关

一般来说,每一张数据库表都应该存在一个 create_time 字段,用于表示这张表的某条数据的插入时间。的 Date 对象表示的是创建该 Date 对象时的时间⏰(包括:年、月、日、时、分、秒、星期 …🍀 上面的代码:传入【1000】作为 Date 类的参数,表示的是格林尼治时间的。(当前时间戳)的话,当遇到低版本的 MySQL 的话就会报错了。🍀 打印出来的时间⏰非常国际范(不符合中国人的阅读习惯😀)类型的参数的话,表示的是:格林尼治时间的。返回的是从格林尼治时间的。🍀 打印出来的时间是。

2024-06-19 23:05:09 387

原创 (超详细)全国职业院校技能大赛-GZ033大数据应用开发-离散数据处理-子任务2数据清洗_gz033 大数据应用开发赛题解析

conf.set(“hive.exec.dynamic.partition.mode”, “nonstrict”) // 设置动态分区模式为nonstrict。conf.set(“hive.exec.dynamic.partition.mode”, “nonstrict”) // 设置动态分区模式为nonstrict。conf.set(“hive.exec.dynamic.partition.mode”, “nonstrict”) // 设置动态分区模式为nonstrict。

2024-05-16 13:34:54 296

原创 (超详细)全国职业院校技能大赛-GZ033大数据应用开发-离散数据处理-子任务2数据清洗_gz033 大数据应用开发赛题解析(2)

还很贴心的每一步的实现都写了一个输出语句,看输出就知道自己卡在了哪里。

2024-05-16 13:34:22 298

原创 (超详细)全国职业院校技能大赛-GZ033大数据应用开发-离散数据处理-子任务2数据清洗_gz033 大数据应用开发赛题解析(1)

这里我想以自己作为scala,IDEA完全0基础的视角,一步步带领你们一起,围绕如何探索一个综合应用这个问题,绝对保姆级,通俗易懂可执行。

2024-05-16 13:33:49 456

原创 (超详细)2024年全国职业院校技能大赛-大数据应用开发-数据可视化-子任务1,2_大数据应用开发比赛 工业数据可视化

创建一个id为chart的div元素,设置宽度和高度。创建一个id为app的div元素。设置文档字符编码为UTF-8。设置视口宽度和初始缩放比例。声明文档类型为HTML5。引入111.js脚本文件。

2024-05-16 13:33:16 570

原创 最新聊聊我在腾讯和字节工作感受_程序员鱼皮,大数据开发中高级面试题

大家好,我是鱼皮,最近这段时间,应该是正值大三的小伙伴最忙碌的时候,不少同学都在准备秋季校园招聘。我当时是通过暑期实习转正进入的腾讯,再加上之前也在字节跳动实习过,所以今天就分享下我对这两家互联网公司的了解和工作感受,希望能帮助大家选择,也可以给还在校园的小伙伴一些坚持的动力吧。

2024-05-16 09:52:49 386

原创 最新聊聊我在腾讯和字节工作感受_程序员鱼皮(3),2024年最新大数据开发开发中遇到最难的问题

我当时是通过暑期实习转正进入的腾讯,再加上之前也在字节跳动实习过,所以今天就分享下我对这两家互联网公司的了解和工作感受,希望能帮助大家选择,也可以给还在校园的小伙伴一些坚持的动力吧。

2024-05-16 09:52:16 402

原创 最新耗时n年,38页《数据仓库知识体系,2024年最新大数据开发自定义View详解

在初期,数据集市的快速实施和较高的成功率让Kimball派占了上风,但是很快,他们也发现自己陷入了某种困境:企业中存在6-7个不同的数据集市,分别有不同的ETL,相互之间的数据也不完全一致。同时,各个项目实施中也任意侵犯了Inmon开始定下的准则:把数据集市当成众多OLTP系统之后的有一个系统,而不是一个基础性的集成性的东西,为保证数据的准确性和实时性,有的甚至可以由OLTP系统直接修改数据集市里面的数据,为了保证系统的性能,有的数据集市删除了历史数据。在后台,是一致性维度的产生、保存和分发的场所。

2024-05-16 09:51:44 480

原创 最新美团分布式 ID 框架 Leaf 介绍和使用_美团leaf算法使用(1),面试学习

下面一起来实践下Leaf的使用。首先拉取LeafSpringBoot使用Maven将Leaf打到本地仓库中打包成功后,可以创建一个SpringBoot项目,在pom。

2024-05-16 09:51:09 287

原创 最全MobileNet实战:tensorflow2(2),2024年最新建议收藏

这里可以看出tensorflow2.0以上的版本集成了Keras,我们在使用的时候就不必单独安装Keras了,以前的代码升级到tensorflow2.0以上的版本将keras前面加上tensorflow即可。tensorflow说完了,再说明一下几个重要的全局参数:norm_size = 224, 设置输入图像的大小,MobileNetV3默认的图片尺寸是224×224。

2024-05-16 02:05:30 293

原创 最全Mapreduce,Spark的区别,Hadoop的简介,2024年大数据开发开发学习路线

Spark框架包含多个紧密集成的组件,包括Spark SQL(即席查询)、Spark Streaming(实时流处理)、Spark MLlib(机器学习库)、Spark GraphX(图计算)。2、易用:Spark支持使用Scala、Python、Java、R等语言快速编写应用。另一部分指广义的,广义上指一个生态圈,泛指大数据技术相关的开源组件或产品,如hbase、hive、spark、pig、zookeeper、kafka、flume、phoenix、sqoop等。

2024-05-16 02:04:57 322

原创 最全MapReduce 出租车数据案例_mapreduce处理train,阿里后台开发

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!}package com.hadoop.Car2;import org.apache.hadoop.conf.Configuration;import org.

2024-05-16 02:04:24 288

原创 最全macos系统安装ElasticSearch和Kibana详细教程,2024年最新我的阿里春招之路分享

你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!2.如果不确认电脑是否安装node.js,前往终端输入node -v或者node --version查看node版本。5.打开bin文件,双击运行elasticsearch。1.在官网上下载elasticsearc。1.首先确保电脑已经安装node.js。6.下图则是运行成功效果。3.下载成功后是压缩包。4.打开解压好的目录。

2024-05-16 02:03:51 454

原创 大数据最新docker-compse安装es(包括IK分词器扩展)、kibana、libreoffice,2024阿里手淘大数据开发面试题目

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新需要这份系统化资料的朋友,可以戳这里获取kibana:image: “kibana:7.9.0”container_name: “kibana”restart: alwaysdepends_on:- elasticsearchenvironme

2024-05-15 17:17:17 328

原创 大数据最新DirectX12(D3D12)基础教程(外篇三)(2),2024年最新大数据开发开发实习面试题

/ 纹理坐标原样输出。// 纹理坐标原样输出。

2024-05-15 17:16:44 287

原创 大数据最新DirectX12(D3D12)基础教程(十二)(2),5年经验大数据开发程序员面试27天

从前一章开始,本系列教程的重点就放到了Shader上来,因此关于本章示例代码中的C++代码部分我就不过多啰嗦了,除非有非常重要的需要注意的地方,大家可以自行从GitHub上下载阅读学习。在这一章的示例中,由于使用了多遍的后处理,并且多次使用了渲染到纹理的技巧,所以综合下来Shader程序就比较多了。主要有下面几个Shader:其中MultiThreadAndAdapter.hlsl文件中,主要是进行常规的基本的3D物体渲染,也就是第一遍渲染的Shader程序。

2024-05-15 17:16:10 425

原创 大数据最新DC-UNet:重新思考UNet架构和双通道高效CNN医学图像_unet改进(1),史上超级详细

本文提出了一种双通道UNet模型-DC-UNet。

2024-05-15 17:15:36 442

原创 大数据最全【一起学数据结构与算法】顺序表的实现(3),大数据开发架构师必备技术

顺序表是用一段的存储单元依次存储数据元素的线性结构,一般情况下采用数组存储。在数组上完成数据的增删查改。其实就是一个数组。那为什么还要写一个顺序表,直接用数组不就好了?不一样的,写到类里面就可以面向对象。静态顺序表适用于确定知道需要存多少数据的场景.静态顺序表的定长数组导致N定大了,空间开多了浪费,开少了不够用.相比之下动态顺序表更灵活, 根据需要动态的分配空间大小.

2024-05-15 14:30:34 333

原创 大数据最全【webpack】从零开始配置webpack系列(基础篇)_webpack (2),2024年最新大数据开发自定义View详解

默认webpack会将文件打包输出到dist目录下,我们查看dist目录下文件情况就好了。

2024-05-15 14:30:02 407

原创 大数据最全【Verilog HDL】FPGA-testbench基础知识(2),2024年最新快速上手

define 标识符 字符串 //注意句末无分号对于上述led闪烁模块,需要产生一个时钟信号给它,为了方便进行全文的修改,我们对时钟信号的周期进行宏定义如果不想让宏定义生效`undef WIDTH //此条语句之后,WIDTH失效//报错,因为宏定义已经取消定义模块名的关键字为module,同时测试模块以endmodule.........endmodule模块名的命名方式一般在被测模块名后面加上_tb,或者在被测模块名前面加上tb_

2024-05-15 14:29:28 285

原创 大数据最全【Three(5),2024年最新大数据开发黑科技实现原理揭秘

【使用 Three.js 实现的效果】

2024-05-15 14:28:54 388

原创 下一代实时数据库:Apache Doris 【三】集群部署_doris的软硬件条件

meta_dir = /opt/module/apache-doris-0.15.0/doris-meta #修改绑定 ip (每台机器修改成自己的 ip)#修改绑定 ip (每台机器修改成自己的 ip)4)查看 BE 状态。2)查看 BE 状态。

2024-05-15 06:04:18 976

原创 下一代实时数据库:Apache Doris 【三】集群部署_doris的软硬件条件(1)

2)修改 fe 的配置文件注意:⚫ 生产环境强烈建议单独指定目录不要放在 Doris 安装目录下,最好是单独的磁盘(如果有 SSD 最好)。⚫ 如果机器有多个 ip, 比如内网外网, 虚拟机 docker 等, 需要进行 ip 绑定, 才能正确识 别。⚫ JAVA_OPTS 默认 java 最大堆内存为 4GB,建议生产环境调整至 8G 以上。3)启动 hadoop1 的 FE。

2024-05-15 06:03:42 1036

原创 下一代企业IT架构:云原生架构_企业it架构已演进到云原生阶段,下列关于云原生化

所谓云原生架构就是以云原生技术为基础和底座,通过最大程度的剥离业务属性功能代码,实现非业务属性能力的统一管理从而实现业务更加敏捷、运营成本更加经济以及伸缩更加灵活的技术架构体系。不知道大家有没有感受,在实际的项目开发中,研发人员真正落到业务需求开发的精力实际可能只有三分之一,其他三分之二的精力在如何保证服务高可用以及如何实现服务高质量运维上面。我们都知道只有业务开发是最重要的,因为它是实际可以为团队或者公司带来实际价值的。

2024-05-15 06:03:06 481

原创 万字长文解密webpack-基本使用 高级用法 性能优化 你想要的全都有!!!_36kr登录 webpack解密

注意:这里需要配置权重 priority,因为抽离的时候会执行第一个common配置,入口处看到jquery也被公用了就一起抽离了,不会再执行wendor的配置了,所以加了权重之后会先抽离第三方模块,然后再抽离公共common的,这样就实现了第三方和公用的都被抽离了。这时候想把a.js, b.js抽离出来合并成一个公共的js,然后在page1, page2中自动引入这个公共的js,项目中分别有a.js, b.js, page1.js, page2.js这四个JS文件,html文件会自动引入main.js。

2024-05-15 06:02:30 609

原创 《Flowable流程引擎从零到壹》Flowable流程引擎介绍和实战项目初始化流程引擎实例(3)

今天认识了什么是flowable流程引擎,也八卦了Flowable与Activiti关系,刺激,哈哈。实战学习了项目初始化流程引擎实例和自动创建Flowable流程引擎的相关表结构。从今天开始Flowable流程引擎的学习之路,一起学习,一起成长。

2024-05-14 21:22:09 1096

原创 《Flowable流程引擎从零到壹》Flowable流程引擎介绍和实战项目初始化流程引擎实例(2)

Flowable是一个使用Java编写的轻量级业务流程引擎。Flowable流程引擎可用于部署BPMN 2.0流程定义(用于定义流程的行业XML标准), 创建这些流程定义的流程实例,进行查询,访问运行中或历史的流程实例与相关数据,等等。Flowable是BPMN的一个基于java的软件实现,不过Flowable不仅仅包括BPMN,还有DMN决策表和CMMN Case管理引擎,并且有自己的用户管理、微服务API等一系列功能,是一个服务平台。

2024-05-14 21:21:33 831

原创 《Flowable流程引擎从零到壹》Flowable流程引擎介绍和实战项目初始化流程引擎实例(1)

/自动创建表结构-表不存在时。//自动创建表结构-表不存在时。* 获取流程引擎对象。* 获取流程引擎对象。

2024-05-14 21:20:56 819

原创 《C语言动漫对话教程(入门篇)》_int a=2 a百分号等于4-1则表达式a加等于a乘等于a减等于a乘于三

位运算可以理解成对二进制数字上的每一个位进行操作的运算。位运算分为 布尔位运算符 和 移位位运算符。布尔位运算符又分为 位与(&)、位或(|)、异或(^)、按位取反(~);移位位运算符分为 左移()。逗号运算通常用于变量的连续定义,如下:return 0;这里的就是逗号表达式。运算符用于执行程序代码运算,会针对一个、两个或多个操作数来进行运算。例如:1 + 2,其操作数是 1 和 2,而运算符则是 “+”(加号)。C语言把除了控制语句和输入输出。

2024-05-14 21:20:20 666

原创 2024年最新大数据领域相关术语总结,2024年最新2024大数据开发大厂面试知识分享

ROI 是一个非常重要的指标,它可以帮助企业评估投资的效果和收益,为企业的战略决策提供依据。在实际应用中,ROI 可以用于评估各种类型的投资,比如广告投放、产品研发、营销活动等,帮助企业优化投资策略,提高效益和收益。

2024-05-14 12:02:20 788

原创 2024年最新大数据领域相关术语总结(2),大数据开发开发谈

例如,Google的BERT模型、OpenAI的GPT模型、Facebook的RoBERTa模型等都是目前最为著名的LLM大模型之一,它们使用了大量的训练数据和强大的计算资源,取得了在自然语言处理领域的重大突破。CVR 指的是广告被点击后,用户进行了期望的行为(比如购买、注册、订阅等)的次数与广告被点击的次数之间的比例,通常以百分比的形式表示。例如,在计算机视觉、音频处理、医疗健康等领域,也可以使用类似的方法,使用大量数据和强大的计算资源来训练大型模型,从而实现更加准确和高效的预测和分析。

2024-05-14 12:01:44 975

原创 2024年最新大数据面试题 —— Zookeeper,2024年互联网大厂大数据开发面经总结

Consistency(一致性)用户在访问分布式系统中的任意节点,得到的数据必须一致。Availability(可用性)用户访问集群中任意的健康节点,必须能得到响应,而不是超时或拒绝。Paratition tolerance(分区容错性)分区:因为网络故障或其他原因导致分布式系统中的部分节点与其他节点失去连接,形成独立的分区。容错:在集群出现分区时,整个系统也要持续对外提供服务。分布式系统无法同时满足这三个指标,这个结论就是 CAP 理论。

2024-05-14 12:01:08 962

原创 2024年最新大数据进阶之 shell 脚本开发(2),大数据开发高级工程师面试实战

止,不再深入研究,那么很难做到真正的技术提升。

2024-05-14 12:00:31 805

原创 2024年最全2024年最新Python大数据之Python基础【六】函数,彻底帮你搞懂

def run():print(‘我跑的老快了,没人追的上我,钱包在我手里’)print(‘我跑的老快了,没人追的上我,手机在我手里’)print(‘我跑的老快了,没人追的上我,女朋友在我手里’)print(‘我再唱青藏高原’)print(‘我再跳广场舞’)sing()dance()print(‘猫吃鱼’)print(‘狗吃肉’)print(‘人吃藕’)def eat(who, food): # 在定义时传入的参数叫做形参,只能在函数体内部使用。

2024-05-14 03:25:00 355 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除