自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 收藏
  • 关注

原创 最新Java数据结构——代码实现双向链表的方法_java实现双向链表(2),今年最新整理的《高频大数据开发面试题集合》

双向链表也叫双链表,是链表的一种,它的每个数据 结点 中都有两个 指针 ,分别指向直接后继和直接前驱。所以,从双向链表中的任意一个结点开始,都可以很方便地访问它的前驱结点和后继结点。一般我们都构造双向 循环链表//标记双向链表的头部//标记双向链表的尾部。

2024-05-16 06:20:49 316

原创 最新Java常见基础面试题整理(带答案)_linkedlist继承自list,附答案解析

在LinkedList中定义了一个内部类Node,每一个数据都会被保存在Node中,在Node中同时记录了它的前一个节点preNode和后一个节点nextNode。查询操作会先判断是在链表的前半部分还是后半部分,然后分别从头结点或尾节点遍历查询数据。对元素操作时,会先根据key的hash值与数组长度计算在数组中的存放位置,找到位置后再判断key是否相同,不相同则作为链表遍历,相同则替换value。但添加或删除可能会导致后面的元素位置都发生变化,会使操作步骤增加,因此添加或删除 可能会速度较慢。

2024-05-16 06:20:16 276

原创 最新java小项目之贪吃蛇项目(图解超详细)_java贪吃蛇,想搞定大厂面试官

/这里再初始化一个用来判断游戏是否开始的,如果没开始的话,就可以进行一些文字提示。g.setFont(new Font(“楷体”,Font.BOLD,20));g.setFont(new Font(“楷体”,Font.BOLD,40));g.setFont(new Font(“楷体”,Font.BOLD,40));//然后再这边定一个一个食物的属性,有坐标,还有一个随机数。//先设置一些变量,蛇的长度和蛇的x轴以及y轴坐标。//这里画完小蛇之后,就进行游戏是否开始的判断。//这里就需要把食物给画出来了。

2024-05-16 06:19:43 414

原创 最新Java基础(八) 常用API与StringBuilder详解,【深夜思考

2:定义一个方法,实现字符串反转。2:定义一个方法,用于把 int 数组中的数据按照指定格式拼接成一个字符串返回。2:定义一个方法,用于把 int 数组中的数据按照指定格式拼接成一个字符串返回。3:在方法中把字符串倒着遍历,然后把每一个得到的字符拼接成一个字符串并返回。//在方法中把字符串倒着遍历,然后把每一个得到的字符拼接成一个字符串并返回。//定义一个 int 类型的数组,用静态初始化完成数组元素的初始化。//定义一个 int 类型的数组,用静态初始化完成数组元素的初始化。

2024-05-16 06:19:11 670

原创 大数据最新集合框架及背后的数据结构_集合框架和背后的数据结构(1),2024年最新9次大数据开发面试经验总结

官方教程Java 集合框架,又被称为容器container,是定义在java.util包下的一组接口interfaces和其实现类classes。其主要表现为将多个元素element置于一个单元中,用于对这些元素进行快速、便捷的存储store、检索retrieve、管理manipulate,即平时我们俗称的增删查改CRUD。例如,一副扑克牌(一组牌的集合)、一个邮箱(一组邮件的集合)、一个通讯录(一组姓名和电话的映射关系)等等。类和接口总览。

2024-05-15 21:32:53 695

原创 大数据最新阿里、字节offer收割系列:数据仓库岗(面试真题,建议收藏(4),最新大数据开发高级面试题汇

我们从业务逻辑的层面上来优化数据倾斜,比如上面的两个城市做推广活动导致那两个城市数据量激增的例子,我们可以单独对这两个城市来做count,单独做时可用两次MR,第一次打散计算,第二次再最终聚合计算。比如订单场景,我们在某一天在北京和上海两个城市多了强力的推广,结果可能是这两个城市的订单量增长了10000%,其余城市的数据量不变。但是在ip表中,我们在统计这个值的时候,为了方便,我们把获取不到ip的用户,统一认为他们的ip为0。的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

2024-05-15 21:32:20 596

原创 大数据最新阿里、字节offer收割系列:数据仓库岗(面试真题,建议收藏(3),2024年最新46道面试题带你了解高级大数据开发面试

我们从业务逻辑的层面上来优化数据倾斜,比如上面的两个城市做推广活动导致那两个城市数据量激增的例子,我们可以单独对这两个城市来做count,单独做时可用两次MR,第一次打散计算,第二次再最终聚合计算。但是在ip表中,我们在统计这个值的时候,为了方便,我们把获取不到ip的用户,统一认为他们的ip为0。两边其实都没有错的,但是一旦我们做关联了,这个任务会在做关联的阶段,也就是sql的on的阶段卡死。因此,解决数据倾斜的重点在于对数据设计和业务的理解,这两个搞清楚了,数据倾斜就解决了大部分了。

2024-05-15 21:31:46 429

原创 大数据最新金九银十|前端真实面试知识点梳理_前端项目经历的 star 法则,2024年最新资深大数据开发开发带你入门Framework

保证函数是独立可复用的,每次实例化一个组件的时候,都是可以生成一个data对象的,相互之间不干扰。

2024-05-15 21:31:13 928

原创 大数据平台搭建——hadoop集群(基于CentOS-7)的搭建_基于centos hadoop搭建

若在 /root/hadoop/dfs/name中出现一个current目录并有一些列文件,即表示格式化成功,注意不要多次格式化会出错。因为克隆机器后的两个子节点和主机点的信息完全一致,因此要把两个子节点的用户名、ip地址根据之前修改的hosts文件改掉,方法和前面一致。后,即可传输,比较麻烦,建议没有要求的情况下使用克隆虚拟机的方法。(3)修改下列启动和停止集群的配置文件(在主节点修改即可)(1)切换到 下载的hadoop文件中的 bin 目录下。(1)选择对应左侧虚拟机的名称,右击选择管理–>克隆;

2024-05-15 10:46:15 359

原创 大数据岗位必知必会的53个Java基础_大数据岗位笔试会有java内容吗

内部类可直接访问外部类的属性Java中内部类主要分为成员内部类局部内部类(嵌套在方法和作用域内)、匿名内部类(没构造方法)、静态内部类(static修饰的类,不能使用任何外围类的非static成员变量和方法, 不依赖外围类)父类型的引用指向子类型的对象。用一句比较通俗的话:同一操作作用于不同的对象,可以产生不同的效果。这就是多态。好处:1.应用程序不必为每一个派生类编写功能调用,只需要对抽象基类进行处理即可。大大提高程序的可复用性。

2024-05-15 10:45:39 310

原创 大数据实验 实验四:NoSQL 和关系数据库的操作比较_实验四nosql和关系数据库的操作比较实验报告

(1)用 Redis 的哈希结构设计出学生表 Student(键值可以用 student.zhangsan 和student.lisi 来表示两个键值属于同一个表);(2)用 hgetall 命令分别输出 zhangsan 和 lisi 的成绩信息;(3)用 hget 命令查询 zhangsan 的 Computer 成绩;(2)用 scan 指令浏览 Student 表的相关信息。(2)获取 scofield 的 English 成绩信息。(3)查询 zhangsan 的 Computer 成绩。

2024-05-15 10:45:02 329

原创 大数据实验 实验四:NoSQL 和关系数据库的操作比较_实验四nosql和关系数据库的操作比较实验报告(2)

(1)用 Hbase Shell 命令创建学生表 Student。(2)用 SQL 语句输出 Student 表中的所有记录。(2)用 scan 指令浏览 Student 表的相关信息。(2)获取 scofield 的 English 成绩信息。(3)查询 zhangsan 的 Computer 成绩。(3)查询 zhangsan 的 Computer 成绩。(4)修改 lisi 的 Math 成绩,改为 95。(4)修改 lisi 的 Math 成绩,改为 95。Student 表如表 A-5 所示。

2024-05-15 10:44:26 262

原创 【入门学习大数据】安装基础设施 一 :VMware & CentOS & 远程工具

和普通的软件安装类似,只是需要一个许可证密钥软件的安装路径等设置,全凭个人的习惯和喜好,必须修改的会以文字说明网上有公开免费的许可证可用,失效了自己上网找找是有的复制粘贴过去,最后点输入。

2024-05-15 02:07:45 310

原创 【入门学习大数据】安装基础设施 一 :VMware & CentOS & 远程工具(4)

复制粘贴过去,最后点输入。

2024-05-15 02:07:09 213

原创 【入门学习大数据】安装基础设施 一 :VMware & CentOS & 远程工具(3)

有能上传:压缩包文件、软件及应用的安装文件,上传和下载速度还可以的网盘/快传,知道的话,可以告知一下我。硬件资源要设置多少,也是自己看着办,自己电脑的余量多就可设多点、少就按最低或建议的设即可。有些人的虚拟机进入这个安装设置界面后,会自动就跳到下一步进入安装,不给设置也没关系的。在安装的过程中,发现卡了,建议不要多次点击,越点越卡,给点耐心就好了。软件的安装路径等设置,全凭个人的习惯和喜好,必须修改的会以文字说明。想自定义的就自定义,嫌麻烦的就直接点完成(一般都是NAT模式的了)

2024-05-15 02:06:33 350

原创 【入门学习大数据】安装基础设施 一 :VMware & CentOS & 远程工具(2)

操作系统。

2024-05-15 02:05:57 260

原创 JavaWeb仓储管理系统优化设计_javaweb基于三层架构完成一个简单的商品库存管理系统

05 | tb_checkrecord | 成本核算表 | 成本核算 || 07 | tb_purchaser | 采购员表 | 采购员 || 06 | tb_purchase | 采购表 | 采购 |3.2数据库逻辑结构设计。4.3管理员登录后界面。4.2用户登录后界面。

2024-05-14 16:45:16 163

原创 JavaWeb仓储管理系统优化设计_javaweb基于三层架构完成一个简单的商品库存管理系统(1)

05 | tb_checkrecord | 成本核算表 | 成本核算 || 04 | tb_record | 出入库记录表 | 出入库记录 || 07 | tb_purchaser | 采购员表 | 采购员 || 03 | tb_warehouse | 仓库表 | 仓库 || 06 | tb_purchase | 采购表 | 采购 |3.2数据库逻辑结构设计。4.3管理员登录后界面。4.2用户登录后界面。

2024-05-14 16:44:40 330

原创 JavaSE进阶 常用类学习(包装类和日期类详解)_java输入日期 包装类

/SimpleDateFormat sdf2 = new SimpleDateFormat(“格式不能随便写,要和日期字符串格式相同”);//int retValue = Integer.parseInt(“中文”);//new出来的,Integer a = new Integer(128);// 重点方法 static int parseInt(String s)//static int parseInt(String s)静态方法。//1.int 转 String 和 String 转 int。

2024-05-14 16:44:04 589

原创 JavaSE基础篇 面向对象三大基本特征【继承】_默认继承object类,还是必须继承

例如:class C extends B,class B extends A,也就是说,C 直接继承 B,B 直接继承 A;,Object类是java 语言提供的根类(老祖宗类),也就是说,一个对象与生俱来就有 Object类型中所有的特征。假设以后的开发中有一个A类,有一个B类,A类和B类确实也有重复的代码,那么他们两个之间就可以继承吗?⭐️① B类继承A类,则称A类为超类(superclass)、父类、基类,A类,有一个B类,A类和B类确实也有重复的代码,那么他们两个之间就可以继承吗?

2024-05-14 16:43:28 359

原创 2024年最全详解Promise使用_promise获取数据(1),2024年最新大数据开发性能优化面试

Promise重构请求。

2024-05-14 08:07:15 754

原创 2024年最全记一次Mysql大数据分页优化问题,2024最新网易大数据开发面试题目

Select” 不加 “Order by”时, MySQL 会尝试以尽可能快的方法(MySQL 实际的方法不见得快)返回数据。GROUP BY 强加了 Order By (这与标准语法冲突,如果要避免,请使用 ORDER BY NULL)这里我有疑问,追根寻底, Select 语句如果不加 “Order By”, MySQL会怎么排序呢?今天遇到一个问题,有一个 Select 语句没有加 “Order By”,返回的数据是不确定的。如上,是关键,因为mysql默认排序的不确定性,所以每次返回的都不一样。

2024-05-14 08:06:39 247

原创 2024年最全认识JS基础与浏览器引擎_js跳转搜索引擎和的意义,成体系化的神级大数据开发进阶笔记,

排版引擎(layout engine) ,也称为浏览器引擎(browser engine)、页面渲染引擎(rendering engine)或样版引擎。JavaScript是一门基于原型、头等函数的语言,是一门多范式的语言,它支持面向对象程序设计,指令式函数,以及函数式编程。Blik:是Webkit的一个分支,Goole开发,目前应用于Goole Chrome 、Edge、Opera等。当然10天设计出来的语言足够说明Brendan Eich是天才,但是这门语言当时更像是一个多种语言的大杂烩;

2024-05-14 08:06:03 650

原创 2024年最全计算机视觉项目-银行卡卡号自动识别_银行自动识别号,2024年最新惊喜

这里就有小伙伴问了,你做的这是啥啊,我们做这些得目的就是要把我们想要的区域拿出来。这里主要就是做了一个轮廓的排序操作,把1就放在1的位置上,没有进行排序是乱的。这里需要注意的就是,**Opencv老版本返回的是三个参数,而新的版本轮廓检测只返回两个参数。我们对轮廓进行一个排序,那么怎么排序呢,利用轮廓的一个横坐标进行排序,这里我们直接跳进myutils程序当中。过滤,然后在进行一次排序。通过过滤操作我们就只剩下了这个部分,但是这里是分为四个部分得,4000,1234,5678,9010.

2024-05-14 08:05:26 625

原创 2024年大数据最新Redis持久化数据之RDB和AOF_redisrdb数据持久化的特点,2024年最新大数据开发插件化主流框架和实现原理

以日志的形式来记录每个写操作(增量保存),将Redis执行过的所有写指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

2024-05-13 23:19:03 666

原创 2024年大数据最新Redis01——Redis入门这一篇就够了(可学习、复习、面试,2024年最新跪了

检查下。(3)安装gccgcc是一款c语言编译依赖的工具软件,由于我们后面需要编译redis源码,因此需要下载安装gcc。查看先,笔者这里就是已经有了,可以看到gcc的版本信息。gcc -v如果没有gcc,可以用如下命令安装。yum -y gcc(4)编译源代码。进入redis目录,执行make,编译src文件夹下的源代码🥥 编译成功如图:🍉 错误:如果您在之前就编译过,但是缺少gcc,重新编译时可能会报错。

2024-05-13 23:18:27 806

原创 2024年大数据最新Redis 大数据量(百亿级)Key存储需求及解决方案,附详细答案解析

该应用场景为DMP缓存存储需求,DMP需要管理非常多的第三方id数据,其中包括各媒体cookie与自身cookie(以下统称supperid)的mapping关系,还包括了supperid的人口标签、移动端id(主要是idfa和imei)的人口标签,以及一些黑名单id、ip等数据。在hdfs的帮助下离线存储千亿记录并不困难,然而DMP还需要提供毫秒级的实时查询。

2024-05-13 23:17:51 540

原创 2024年大数据最新Redis 大数据量(百亿级)Key 存储需求及解决方案(3),零基础学习大数据开发

需要为全量数据提供服务,supperid是百亿级、媒体映射是千亿级、移动id是几十亿级;每天有十亿级别的mapping关系产生;对于较大时间窗口内可以预判热数据(有一些存留的稳定cookie);对于当前mapping数据无法预判热数据,有很多是新生成的cookie;

2024-05-13 23:17:13 669

原创 猿创征文|瑞吉外卖——移动端_笔记_瑞吉外卖项目前端页面黑屏(2)

Authenticator authenticator = new 工具类(“邮箱(自己的,由此邮箱发送文件)”, “授权码”);//发送邮件的地址/就填你的qq邮箱。// Message.RecipientType.TO属性表示接收者的类型为TO。//邮箱smpt协议 ,QQ邮箱。//设置utf-8类型。

2024-05-12 20:22:14 656

原创 猿创征文|瑞吉外卖——移动端_笔记_瑞吉外卖项目前端页面黑屏(1)

本项目基于B站视频链接【黑马程序员Java项目实战《瑞吉外卖》,轻松掌握springboot + mybatisplus开发核心技术的真java实战项目】 https://www.bilibili.com/video/BV13a411q753?

2024-05-12 20:21:38 337

原创 猿创征文|提升日常工作效率的软件工具分享_beyond compare 4自动换行

当我们记不清文件的具体名称时,可以使用关键字去搜索,搜索速度非常快,推荐大家去使用一下。

2024-05-12 20:21:02 857

原创 猿创征文|提升日常工作效率的软件工具分享_beyond compare 4自动换行(1)

这些大型开源项目的源代码的大小就占到了数个GB以上,且很多这种大型的开源库都是通过交叉编译工具编译的,并没有提供Visual Studio工程文件,没法直接使用Visual Studio去查看源代码。Source Insight是个小巧轻便的工具,可以快速启动,使用过程中占用很少的资源(CPU和内存资源),可以快速地浏览和编辑代码,和大型臃肿的IDE软件相比,这些都是该工具明显的优势。除了远程办公,在日常工作中也会用到,比如远程到同事的电脑上看问题,远程到客户的电脑上排查软件异常问题等。

2024-05-12 20:20:26 656

原创 大数据系统开发实践项目——安装完全分布式Hadoop集群并利用MapReduce实现倒排索引(北理工大三小学期)

(1)invertedindexmapper类继承自Mapper类,用于处理Map阶段的任务。(2)读入键值对的数据类型为,其中LongWritable用于读入key,无实际意义,Text用于读入待处理的文本句子数据。(3)输出键值对的数据类型定义为,其中两个Text表示单个单词作为键,句子的编号与出现次数的组合作为值。

2024-05-12 03:12:36 986

原创 大数据系统开发实践项目——安装完全分布式Hadoop集群并利用MapReduce实现倒排索引(北理工大三小学期)(1)

接着,在倒排索引的构建过程中,再次运用MapReduce任务,应用TF-IDF算法,将词项映射到包含它的文档,并记录词项在文档中的位置信息,以计算每个词项的在文档中的重要性,确保了对文档的全面索引,为后续的搜索排序提供基础。Reduce阶段首先以键值对形式接收来自Map部分的输出,其中键为词项,值为文档ID和文档内容的列表,然后针对相同的词项,将它们对应的文档ID和文档内容列表合并,形成倒排索引的条目,最后生成输出最终的键值对,其中键为词项,值为包含该词项的文档ID和位置信息。

2024-05-12 03:12:00 640

原创 大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm

知识图谱是将知识连接起来形成的一个网络。由节点和边组成,节点是实体,边是两个实体的关系,节点和边都可以有属性。知识图谱除了可以查询实体的属性外,还可以很方便的从一个实体通过遍历关系的方式找到相关的实体及属性信息。BERT是一种基于Transformer 架构的预训练语言模型,能够捕捉双向上下文信息。BERT 模型在大规模语料上进行预训练,然后可以通过微调来适应特定任务,BERT 可用于处理输入文本,提取丰富的语义信息。它可以用于文本的编码和表征学习,以便更好地理解医学问答中的问题和回答。

2024-05-12 03:11:24 909

原创 大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm(1)

Django是一个开放源代码的Web应用框架,由Python写成。采用了MVC的软件设计模式,即模型M,视图V和控制器C。用于创建模型的对象关系映射为最终用户设计的完美管理界面一流的 URL 设计设计者友好的模板语言缓存系统。在Django中,控制器接受用户输入的部分由框架自行处理,所以 Django 里更关注的是模型(Model)、模板(Template)和视图(Views),称为 MTV模式。层次模型(Model),即数据存取层模板(Template),即表现层。

2024-05-12 03:10:48 809

原创 大数据最全Tomcat安装使用与部署Web项目的三种方法_tomcat部署web项目(2),干货分享

🔥前言今天带来Tomcat的安装教程,也会讲到各种目录下代表的含义,重点是在Tomcat服务器上面部署Web项目的三种方法。

2024-05-11 18:32:51 428

原创 大数据最全tensorflow2 minist手写数字识别数据训练(2),2024年最新大数据开发开发面试技能介绍

只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**将说明加在代码注释,方便查看复习。

2024-05-11 18:32:15 297

原创 大数据最全TDengine:开源、高效的物联网大数据平台(1),2024年最新头条大数据开发面试节奏

TDengine是涛思数据专为物联网、车联网、工业互联网、IT运维等设计和优化的大数据平台,广泛运用于物联网、车联网、工业互联网、IT运维等领域。它和上述的平台主要区别是,分成社区版、企业版和云服务版,其中社区版免费开源面向广大用户。北京涛思数据科技有限公司创始人陶建辉将目标瞄准物联网数据市场,专注时序空间大数据的存储、查询、分析和计算。目前公司已经获得红杉资本中国基金、经纬中国、GGV纪源资本、指数资本、永辉瑞金、明势资本、蛮子基金等多家机构的投资。

2024-05-11 18:31:39 629

原创 大数据最全Spark面试题 精选 (附答案)(1),斗鱼大数据开发开发二面被刷

由于RDD是粗粒度的操作数据集,每个Transformation操作都会生成一个新的RDD,所以RDD之间就会形成类似流水线的前后依赖关系;**宽依赖:**是指一个父RDD的Partition会被多个子RDD的Partition所使用,例如groupByKey、reduceByKey、sortByKey等操作都会产生宽依赖。**窄依赖:**是指每个父RDD的一个Partition最多被子RDD的一个Partition所使用,例如map,filter,union等操作都会产生窄依赖;

2024-05-11 18:31:03 518

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除