自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(85)
  • 收藏
  • 关注

原创 机器学习算法(7)—— 朴素贝叶斯算法(1)

(1)优点朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率对缺失数据不太敏感,算法也比较简单,常用于文本分类分类准确度高,速度快(2)缺点由于使用了样本属性独立性的假设,所以如果特征属性有关联时其效果不好需要计算先验概率,而先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳;先验概率:直观理解,所谓“先”,就是在事情之前,即在事情发生之前事情发生的概率。是根据以往经验和分析得到的概率,“由因求果”。

2024-05-01 08:05:59 522

原创 机器学习算法(5)—— 集成学习算法_集成学习算法库

集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。机器学习的两个核心任务如何优化训练数据 —> 主要用于解决欠拟合问题如何提升泛化性能 —> 主要用于解决过拟合问题只要单分类器的表现不太差,集成学习的结果总是要好于单分类器的目标:把下面的圈和方块进行分类实现过程(1)采样不同数据集(2)训练分类器(3)平权投票,获取最终结果。

2024-05-01 08:05:28 476

原创 机器学习算法(2)—— 线性回归算法

线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。h代表学习算法的解决方案或函数,也称为假设(hypothesis),h(x)代表预测的值只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归特征值与目标值之间建立了一个关系,这个关系可以理解为线性模型。线性回归当中主要有两种模型,一种是线性关系,另一种是非线性关系数据集介绍(1)线性回归:正规方程:是否计算偏置。

2024-05-01 08:03:45 543

原创 机器学习算法(2)—— 线性回归算法(1)

线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。h代表学习算法的解决方案或函数,也称为假设(hypothesis),h(x)代表预测的值只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归特征值与目标值之间建立了一个关系,这个关系可以理解为线性模型。线性回归当中主要有两种模型,一种是线性关系,另一种是非线性关系数据集介绍(1)线性回归:正规方程:是否计算偏置。

2024-05-01 08:03:14 323

原创 python面试题总结(二)_给定2个字符串a=“abcdefg”,b=“abfyt

打印结果依次为:TrueTrueFalse打印结果依次为:TrueFalseFalse同源策略需要同时满足3点要求举例来说:http://www.example.com/dir/page.html协议是 http://域名是 www.example.com端⼝是 80(默认端⼝可以省略)同源政策的⽬的,是为了保证⽤户信息的安全,防⽌恶意的⽹站窃取数据。当程序中可能出现并发的情况时,就需要保证在并发情况下数据的准确性,以此确保当前用户和其他用户一起操作时,所得到的结果和他单独操作时的结

2024-04-30 03:36:43 512

原创 python面试题总结(二)_给定2个字符串a=“abcdefg”,b=“abfyt(1)

同源策略需要同时满足3点要求举例来说:协议是 http://域名是 www.example.com端⼝是 80(默认端⼝可以省略)

2024-04-30 03:36:12 760

原创 Python面试题大全(五):测试、大数据、数据结构(3)

数据结构**数列定义: **根据定义速度很慢,另外(暴栈注意!⚠️️)return 1线性时间的状态/循环return a递归a, b = syield 1yield fib矩阵不是矩阵if n == 0:c = a + b。

2024-04-30 03:34:30 500

原创 Python面试题大全(五):测试、大数据、数据结构(2)

*数列定义: **根据定义速度很慢,另外(暴栈注意!⚠️️)return 1线性时间的状态/循环return a递归a, b = syield 1yield fib矩阵不是矩阵if n == 0:c = a + b。

2024-04-30 03:33:59 627

原创 大数据量Excel导出优化

【代码】大数据量Excel导出优化。

2024-04-28 18:31:21 155

原创 大数据进阶(一):4个最受欢迎的大数据可视化工具(抛砖引玉篇)_silver bullet 图表工具

尽管实际上存在着无数专门用于大数据可视化的工具,且它们都是既开源又专有的,在这其中还是有一些工具表现比较突出,因为它们提供了上述所有或者很多部分功能。我们将介绍4种最受欢迎的大数据可视化工具,帮助大家选择适合自己需求的工具。

2024-04-28 18:30:18 816

原创 大数据进阶(一):4个最受欢迎的大数据可视化工具(抛砖引玉篇)_silver bullet 图表工具(1)

大数据可视化是进行各种大数据分析解决的最重要组成部分之一。一旦原始数据流被以图像形式表示时,以此做决策就变得容易多了。尽管实际上存在着无数专门用于大数据可视化的工具,且它们都是既开源又专有的,在这其中还是有一些工具表现比较突出,因为它们提供了上述所有或者很多部分功能。我们将介绍4种最受欢迎的大数据可视化工具,帮助大家选择适合自己需求的工具。

2024-04-28 18:29:47 410

原创 大数据进阶之路——Spark SQL日志分析_spark 捕获异常sql语句(1)

执行第一步数据清洗时候,数据能打印出来,但是不能写入本地文件,这是因为本地没有hadoop伪分布式系统。按照日志中的访问时间进行相应的分区,比如:d,h,m5(每5分钟一个分区)下载上述插件,然后,新建目录并且放入到目录里面。一般的日志处理方式,我们是需要进行分区的,3)安装jar包到自己的maven仓库。使用github上已有的开源项目。找到分割后各个字段的对应的。检查插入参数和类型是否一直。然后再系统环境变量添加。

2024-04-28 18:28:03 320

原创 SD-WAN不断冲击传统WAN架构_sd-wan变得更加复杂,更加多样化,单一技术已无法满足

企业可以选择SD-WAN《夽易联》的驱动原则是简化公司建立与分支机构的新链接的方式,通过更快速、高效简单和极具性价比的部署好各分支之间的网络互通,更快地开展企业的业务需求,在这个快节奏的时代,信息瞬息万变,企业希望通过其 WAN 更轻松地管理多种连接类型,以提高应用程序性能和最终用户体验。在多种因素的推动下,传统企业 WAN 越来越无法满足当今现代数字业务的需求,尤其是在支持 SaaS 应用程序以及多云和混合云使用方面。

2024-04-28 04:07:07 562

原创 SD-WAN不断冲击传统WAN架构_sd-wan变得更加复杂,更加多样化,单一技术已无法满足(2)

SD-WAN从诞生于2015年,到现在市场上已经拥有大批量的SD-WAN服务商,例如:光联网络,中企通信和夽谷科技的SD-WAN《夽易联》等,这些都是SD-WAN服务中的佼佼者,有多年的服务经验和技术沉淀,并且不仅仅停留在了最初的组网,嵌入了安全机制,完善了企业的各种需求。此外,相比于互联网宽带或无线广域网(4G、5G)链路而言,回程的成本比仅仅允许流量直接从分支机构直接突发到互联网更加昂贵,因为分支机构和总部之间基于 MPLS 的传统连接成本更高。

2024-04-28 04:06:36 726

原创 RT-Thread 双向链表(学习笔记)_rtt中的链表

/ 原链表结构体:head ->> node1 ->> node2 ->> node3。if(node3->prev == node1) // 后面的节点是否与前面的节点相连。// 释放 node2 的内存。// 双向链表的节点1。// 双向链表的节点2。rt_kprintf(“动态内存申请成功”);// 将 node1 插入到 node2 前面。rt_kprintf(“删除节点成功\n”);

2024-04-28 04:05:33 827

原创 RocketMQ与Kafka架构深度对比_kafka与rocketmq多方面剖析

在分布式系统中,消息中间件扮演着至关重要的角色,它们负责在系统组件之间传递消息,实现解耦、异步通信和流量削峰等功能。RocketMQ与Kafka作为两款流行的消息中间件,各自拥有独特的架构设计和功能特性。本文将深入对比分析RocketMQ与Kafka在架构设计、组件构成、数据流向、扩展性、容错性和一致性等方面的差异,帮助读者更好地理解这两款消息中间件的特点和适用场景。

2024-04-28 04:05:02 762

原创 大数据面试专题 -- kafka

在kafka中使用幂等性来保证数据不重复的,在发送数据的时候,会给数据定义一个编号ID,当下次传输数据的时候ID+1,将数据写入的时候会记住这个编号,如果下一条数据的ID与上一个数据的ID一致,那么说明数据重复,不写入,返回ack。2、kafka是批量写入和读取的,一批批的写入数据,默认写入和读取的大小约64kb左右。在分区中的leader是通过ISR进行选举的。1、消费者是负责订阅分区中的数据,然而对于消费者组来说是负责订阅topic的。2、增加副本因子,可以提高数据的冗余,提高数据的可靠性。

2024-04-27 12:40:07 627

原创 回归分析预测世界大学综合得分_世界大学排名预测可以用什么模型(1)

从评价指标上看貌似我们能根据各方面排名较好的预估综合得分,接下来我们观察一下学习到的参数,即各指标排名对综合得分的影响权重。这里会发现综合得分的预测基本被「师资质量」这一自变量主导了,「就业」和「教育质量」这两个因素也有一定影响,其他指标起的作用就很小了。的方法观察变量之间的关联关系,可以从图中看到,少部分变量之间有线性关系;观察世界排名前十学校的平均得分情况,为此需要将同一学校不同年份的得分做一个平均。为了观察「师资质量」这一主导因素与综合得分的关系,我们可以通过 seaborn 中的。

2024-04-27 10:47:59 334

原创 【面试系列】Java面试知识篇(五)_error (46, 44) java -source 8 中不支持 try-with-resou

Java泛型是JDK5引入的一个新特性,使用泛型可以增加代码的可读性以及稳定性,编译器可以对泛性参数进行检测,并且通过泛型参数可以指定传入的对象类型。泛型一般有三种使用方式:泛型类、泛型接口、泛型方法泛型类:return t;this.t = t;泛型方法:return t;泛型接口:@Overridestr.show("加油");i.show(30);

2024-04-27 08:39:30 994

原创 【Web前端面试】葵花宝典(2024版本)——HTTP 浏览器 篇_葵花宝典浏览器网站

WebSocket是HTML5中的协议,支持持久连续,http 协议不支持持久性连接。Http1.0和HTTP1.1都不支持持久性的链接,HTTP1.1中的keep-alive,将多个 http 请求合并为 1 个。

2024-04-27 06:49:56 807

原创 《Redis实战篇》五、分布式锁-redission(1)

在Lock锁中,他是借助于底层的一个voaltile的一个state变量来记录重入的状态的,比如当前没有人持有这把锁,那么state=0,假如有人持有这把锁,那么state=1,如果持有这把锁的人再次持有这把锁,那么state就会+1 ,如果是对于synchronized而言,他在c语言代码中会有一个count,原理和state类似,也是重入一次就加一,释放一次就-1 ,直到减少成0 时,表示当前这把锁没有被人持有。KEYS[2]和ARGV[1]所代表的含义我们后面会讲解~

2024-04-27 05:01:26 766

原创 MobileNet实战:tensorflow2

将list转numpy数组。返回一次迭代else:第五步 保留最好的模型和动态设置学习率语法如下:该回调函数将在每个epoch后保存模型到filepathfilepath可以是格式化的字符串,里面的占位符将会被epoch值和传入on_epoch_end的logs关键字所填入例如,filepath若为weights.{epoch:02d-{val_loss:.2f}}.hdf5,则会生成对应epoch和验证集loss的多个文件。当学习停滞时,减少2倍或10倍的学习率常常能获得较好的效果。

2024-04-27 02:55:09 846

原创 Git详解(带图) --- 本地电脑的工作区、暂存区、本地仓与远程仓_git 工作区域

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新需要这份系统化资料的朋友,可以戳这里获取大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**需要这份系统化资料的朋友,可以戳这里获取。

2024-04-27 01:12:59 348

原创 真的已经讲烂了!靠着这份面试题跟答案,学习路线+知识点梳理_哪种技术衰期短

简历首选内推方式,速度快,效率高啊!然后可以在拉钩,boss,脉脉,大街上看看。简历上写道熟悉什么技术就一定要去熟悉它,不然被问到不会很尴尬!做过什么项目,即使项目体量不大,但也一定要熟悉实现原理!不是你负责的部分,也可以看看同事是怎么实现的,换你来做你会怎么做?做过什么,会什么是广度问题,取决于项目内容。但做过什么,达到怎样一个境界,这是深度问题,和个人学习能力和解决问题的态度有关了。大公司看深度,小公司看广度。大公司面试你会的,小公司面试他们用到的你会不会,也就是岗位匹配度。

2024-04-18 13:49:33 324

原创 真正带你搞懂RecyclerView的缓存机制,吐血整理,2024年最新2024最新中高级HarmonyOS鸿蒙面试题目

6、Android启动Service的两种方式是什么?14、同一个类里面两个synchronized方法,两个线程同时访问的问题。4、Android与服务器交互的方式中的对称加密和非对称加密是什么?5.为什么TCP是可靠的,UDP早不可靠的?9、请介绍下AsyncTask的内部实现,适用的场景是?13、Android中touch事件的传递机制是怎样的?17、Android下解决滑动冲突的常见思路是什么?7、谈谈你对Android中Context的理解?5、设备横竖屏切换的时候,接下来会发生什么?

2024-04-18 13:48:31 355

原创 干货 Apache Flink 入门技术分享 PPT(多图预警)_flink ppt

如果用一句话聊聊什么是 Apache Flink 的命脉?Apache Flink 是以"批是流的特例"的认知进行系统设计的。就目前最热的两种流计算引擎 Apache Spark 和 Apache Flink 而言,谁最终会成为No1呢?单从 “低延时” 的角度看,Spark是Micro Batching(微批式)模式,延迟Spark能达到0.5~2秒左右,Flink是Native Streaming(纯流式)模式,延时能达到微秒。很显然是相对较晚出道的 Apache Flink 后来者居上。

2024-04-18 08:32:02 565

原创 常见【小程序】内置组件_小程序 select,2024年最新7年老大数据开发一次坑爹的面试经历

space有三个取值(了解), 设置如何显式连续空格。当然我们也可以自己通过修改css来设置按钮的样式。decode可以解析的有 < > & ’decode是否解码(了解)小程序插件中不能使用。小程序插件中不能使用。小程序插件中不能使用。

2024-04-18 08:31:00 231

原创 助力工业物联网,工业大数据之事实主题指标划分【十八】_事实指标值的分类

(img-YcA0K3pg-1713380973611)]统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)**

2024-04-18 03:10:45 647

原创 助力工业物联网,工业大数据之ST层的设计【二十五】,高并发系统基础篇

上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。(img-qP3cnd8E-1713380912401)]:按照一站制造的业务主题的划分需求,构建每个主题的ST层的数据。:对DWB层的主题事实数据关联DWS层的维度表进行最终聚合。:数据应用层,用于支撑对外所有主题的报表应用数据的结果。- 呼叫中心主题事实。

2024-04-18 03:09:44 634

原创 【毕业设计】 基于Springboot的测试项目管理平台(论文+源码)_基于spring boot (1)

随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,测试项目管理平台当然也不能排除在外。详细设计主要包括系统数据库访问的实现,主要功能模块的具体实现,模块实现关键代码等。最后对系统进行功能测试,并对测试结果进行分析总结,得出系统中存在的不足及需要改进的地方,为以后的系统维护提供了方便,同时也为今后开发类似系统提供了借鉴和帮助。在设计过程中,充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。

2024-04-17 21:39:43 368

原创 【毕业季】科班大二拿到满意offer的成长之路_大二拿offer(1)

本人是2024届毕业的一名大二学生,对于个人以后的人生规划更偏向于就业,目前也是通过自己的努力拿到了一个某央企的offer。

2024-04-17 21:38:41 890

原创 【JDBC-Hive】使用JDBC操作Hive数据库_jdbc操作hive到本地

【代码】【JDBC-Hive】使用JDBC操作Hive数据库_jdbc操作hive到本地。

2024-04-17 17:12:22 300

原创 【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片(附源码)_游戏数据抓取

本文通过实战案例的方式来讲解和应用WebMagic这个Java爬虫框架。在爬虫的过程中,其实对于页面内容的解析是很重要的。所以在这一步的时候提醒大家需要用心一点哦。如果本文章对你有用,请不要忘记一键三连!网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)一个人可以走的很快,但一群人才能走的更远!

2024-04-17 17:11:22 737

原创 Prometheus监控Kafka(三种方法JMX Kafka_exporter KMINION监控Kafka)_kafka exporter

目的是下次启动kafka进程的同时,运行一个jmx-agent并指定agent的端口。使用curl命令重启prometheus的前提是:首次启动Prometheus时,就启用。下载dashboard模板,配合jmx-agent使用时,建议使用11962号模板。使用阿里云提供的jmx-agent包,比较稳定靠谱,就不故意选择最新版本了。份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)**修改kafka启动脚本的配置参数,可参考阿里云。这一行之后,新增JMX-agent内容。

2024-04-17 09:24:07 746

原创 Prism框架简介及其项目创建方法,2024年最新【原理+实战+视频+源码】

模块之间可以松散组合,在对整个Prism中模块化设计思想有一个认识之前我们先来看看下面这张图,通过这张图从而让我们对整个Module有一个更加清晰的认识。是一种用于开发模块化、可重用和可测试的WPF应用程序的框架。它提供了一种简单而强大的方式来管理复杂应用程序的代码和构建高度可扩展的应用程序。安装完成后,重启vs2022,创建项目,就可以看到wpf的prism创建项目模板。从上面的图中我们知道Module是位于Shell的下一层的概念,重新打开vs2022后,可以看到新增了Prism相关的项目模板。

2024-04-17 09:22:27 387

原创 hbase可视化:hbaseGUI的安装与使用_hbase gui,2024年最新你连原理都还没弄明白

不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!Windows解压到 用户主目录/.hbase-gui-conf/ 下。Mac用户解压到 ~/.hbase-gui-conf/window用户为admin,就把driver.zip解压到C:\Users\admin.hbase-gui-conf中。配置好之后选择hbase的版本,选择与自己安装hbase版本相近的。查询有很多方式都可以。

2024-04-17 03:55:28 264

原创 Hbase 王者荣耀数据表 HBase常用Shell命令,一线大厂架构师都推荐的大数据开发零基础大全

HBase使用put命令添加数据,一次只能为一个表的一行数据的一个列(也就是一个单元格,单元格是HBase中的概念)添加一个数据,所以,直接用Shell命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据。在修改数据时,HBase会为修改后的数据生成一个新的版本(时间戳),从而完成“改”操作,旧的版本依旧保留,系统会定时回收垃圾数据,只留下最新的几个版本,保存的版本数可以在创建表的时候指定。(img-ROVMJmu3-1713297226751)]下面继续添加4个单元格的数据,用来记录。

2024-04-17 03:54:58 659

原创 c语言结构体看这篇文章就够啦(详细介绍结构体)_c语结构体原理(1)

我们也可以进行对偏移量的打印来确认一下。

2024-04-16 22:46:04 643

原创 C语言练手小项目(巩固加深知识点理解)_好玩的c语言项目

cout

2024-04-16 22:45:02 910

原创 鸿蒙HarmonyOS开发实战—AI功能开发(词性标注)_鸿蒙开发和ai开发哪个好

word 否 String 切分出的词。+tag 否 String 词性,type为1或9223372036854775807时,人名实体的词性为nr,时间实体的词为t,地点实体的词性为ns,其他实体统一为ne。| +tag | 否 | String | 词性,type为1或9223372036854775807时,人名实体的词性为nr,时间实体的词为t,地点实体的词性为ns,其他实体统一为ne。| pos | 否 | JSONArray | 切分出的词数组,数组里的类型为JSONObject。

2024-04-16 05:38:06 890 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除