自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(291)
  • 收藏
  • 关注

原创 面试怕被问算法?50个大厂、987页大数据、算法项目落地经验教程合集!

同时,随着文本、语音、视觉等智能技术的不断深入,知识图谱在复杂知识表示、多模语义理解技术与应用等方面都面临新的挑战与机遇。有怎样的技术方案沉淀?滴滴出行作为移动出行领域的一家领先的移动互联网企业,也正积极布局和利用智能语音交互相关技术,如语音识别、语音对话理解、语音合成等,以便更好的为司机和乘客提供高质量服务,具体地,包含有司机智能助手和滴滴智能客服系统等应用产品。本议题首先介绍美团智能客服的对话交互框架,然后就我们在其中意图挖掘、意图理解、情绪识别、对话管理等核心模块中用到的机器学习算法进行详细的介绍。

2024-05-16 13:18:06 397

原创 面试怕被问算法?50个大厂、987页大数据、算法项目落地经验教程合集!(2)

有怎样的技术方案沉淀?滴滴出行作为移动出行领域的一家领先的移动互联网企业,也正积极布局和利用智能语音交互相关技术,如语音识别、语音对话理解、语音合成等,以便更好的为司机和乘客提供高质量服务,具体地,包含有司机智能助手和滴滴智能客服系统等应用产品。本议题首先介绍美团智能客服的对话交互框架,然后就我们在其中意图挖掘、意图理解、情绪识别、对话管理等核心模块中用到的机器学习算法进行详细的介绍。智能客服是一种使用自然语言与用户交互的人工智能系统,通过分析用户意图,以人性化的方式与用户沟通,向用户提供客户服务。

2024-05-16 13:17:33 304

原创 面试怕被问算法?50个大厂、987页大数据、算法项目落地经验教程合集!(1)

有怎样的技术方案沉淀?滴滴出行作为移动出行领域的一家领先的移动互联网企业,也正积极布局和利用智能语音交互相关技术,如语音识别、语音对话理解、语音合成等,以便更好的为司机和乘客提供高质量服务,具体地,包含有司机智能助手和滴滴智能客服系统等应用产品。本议题首先介绍美团智能客服的对话交互框架,然后就我们在其中意图挖掘、意图理解、情绪识别、对话管理等核心模块中用到的机器学习算法进行详细的介绍。智能客服是一种使用自然语言与用户交互的人工智能系统,通过分析用户意图,以人性化的方式与用户沟通,向用户提供客户服务。

2024-05-16 13:17:00 309

原创 面试官:熟悉Redis?请讲讲Redis缓存穿透、缓存击穿、缓存雪崩有什么区别_为什么redis缓存穿透与缓存雪崩的区别

key对应的数据存在,但在redis中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。通俗的说:Redis中的某个key失效了,大量的请求都在使用这个过期的key,导致无法命中Redis中的缓存数据,压力都给到了服务器查询源数据库,最终源数据库承受不了瞬时剧增的请求,然后崩溃。现象数据库访问的压力突然急剧增大Redis中并没有出现大量的key失效Redis服务器平稳运行数据库崩溃缓存击穿怎么产生?

2024-05-16 13:16:27 302

原创 最新案例驱动 :从入门到掌握Shell编程详细指南_shell编程指南(2),2024年最新2024大数据开发精选面试实战总结整理

n(功能描述:n为数字,$0代表该脚本名称,$1-9代表第一到第九个参数十以上的参数十以上的参数需要用大括号包含如9代表第一到第九个参数,十以上的参数,十以上的参数需要用大括号包含,如9代表第一到第九个参数,十以上的参数,十以上的参数需要用大括号包含,如{10})案例:输出该脚本文件名称、输入参数1和输入参数2 的值$# (功能描述:获取所有输入参数个数,常用于循环)案例:获取输入参数的个数。

2024-05-16 09:35:56 346

原创 最新机器学习算法(7)—— 朴素贝叶斯算法(1),2024年最新2024最新大数据开发开发面试大全

(1)优点朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率对缺失数据不太敏感,算法也比较简单,常用于文本分类分类准确度高,速度快(2)缺点由于使用了样本属性独立性的假设,所以如果特征属性有关联时其效果不好需要计算先验概率,而先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳;先验概率:直观理解,所谓“先”,就是在事情之前,即在事情发生之前事情发生的概率。是根据以往经验和分析得到的概率,“由因求果”。

2024-05-16 09:35:23 373

原创 最新机器学习算法(5)—— 集成学习算法_集成学习算法库(2),大数据开发开发工程师面试题目

integer,optional(default = 10)森林里的树木数量120,200,300,500,800,1200在利用最大投票数或平均值来预测之前,你想要建立子树的数量。Criterion:string,可选(default =“gini”)分割特征的测量方法max_depth:integer或None,可选(默认=无)树的最大深度 5,8,15,25,30="auto”,每个决策树的最大特征数量bootstrap是否在构建树时使用放回抽样内部节点再划分所需最小样本数。

2024-05-16 09:34:50 292

原创 最新机器学习概述(1),大数据开发软件开发基础

y_true:每个样本的真实类别,必须为0(反例),1(正例)标记。计算ROC曲线面积,即AUC值。

2024-05-16 09:34:17 397

原创 最全Java 版本、语言规范、API、JDK、IDE,2024年最新高级开发面试题及答案

Java 是一个全面且功能强大的软件。Java 语言规范和 Java API 定义 Java 的标准。本文对 Java 中最为常见的几个英文单词如 JDK、JRE、IDE 等作了简单介绍,同时介绍了不同版本类型之间的开发区别和语言规范、数据类型等。希望能对你初学 Java 有一个认知。

2024-05-16 01:46:59 633

原创 最全java 操作大数据量的Excel,2024年最新2024我是如何拿到小米、京东、字节的offer

其中ExcelProperty对应的就是我们的列名,更多详细的描述可以自行查看开发手册,由于文章篇幅限制,我把getter和setter方法删除了,自己可以自行添加进去。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。// 达到BATCH_COUNT了,需要去存储一次数据库,防止数据几万条数据在内存,容易OOM。log.info(“成功存储” + saveNum + “数据库成功!// 这里也要保存数据,确保最后遗留的数据也存储到数据库。

2024-05-16 01:46:26 453

原创 最全iVX低代码平台系列详解 -- 系统架构_低代码平台技术架构,2024年最新这原因我服了

前台部分,对应前端应用程序,负责。在iVX中,前端程序支持多种类型,包括。在运行时,每个用户都会在本地客户端下载或安装一份前端程序来运行;后台部分,对应服务端程序,部署在后台服务器(集群)中,负责后台数据与通信逻辑的处理应用编辑举例:假设我们要做一个简单的表单提交应用,其应用架构如下:左侧用户界面,即前端应用,其运行在用户的浏览器端,负责收集用户填写的信息;右侧的数据库表,即后台资源,负责存储所有用户提交的信息;

2024-05-16 01:45:53 758

原创 最全InceptionV3实战:tensorflow2,大数据开发零基础

else:第五步 保留最好的模型和动态设置学习率语法如下:该回调函数将在每个epoch后保存模型到filepathfilepath可以是格式化的字符串,里面的占位符将会被epoch值和传入on_epoch_end的logs关键字所填入例如,filepath若为weights.{epoch:02d-{val_loss:.2f}}.hdf5,则会生成对应epoch和验证集loss的多个文件。当学习停滞时,减少2倍或10倍的学习率常常能获得较好的效果。

2024-05-16 01:45:21 723

原创 大数据最新2024年Python+大数据学习路线图 内附「路线+视频」_python,2024年最新算法题+大数据开发+自定义View

PS:等不及的同学可以直接翻到文末点击阅读原文查看路线图。

2024-05-15 17:00:23 328

原创 大数据最新2024年408计算机学科专业基础综合考研初试大纲_408考试大纲2024,大厂面试经验分享

通过学习这些内容,学生可以全面了解计算机科学与技术的基本原理和应用,为未来的职业发展打下坚实的基础。同时,408大纲的内容也与当前计算机行业的发展趋势相符,使学生具备了适应未来科技发展的能力和素养。因此,学生应该充分重视408大纲的学习,努力掌握其中的知识和技能,以便在未来的工作中取得更好的成就。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!3.3 大数据技术:包括大数据存储、分析和处理的方法和工具。

2024-05-15 16:59:50 352

原创 大数据最新2024大数据面试题+附答案,腾讯T3亲自讲解

(img-omWBpLsD-1715763535960)](img-JA5c2E5Y-1715763535960)]41. 在Flume的配置文件中,如何设置数据的压缩格式?44. 在Flume中,如何设置数据的失效时间?42. 如何在Flume中设置数据的备份方式?47. 如何在Flume中设置数据的优化策略?49. Flume中如何实现数据的非阻塞发送?50. 如何在Flume中实现数据的精确控制?43. 如何在Flume中实现数据的归档?45. 如何在Flume中实现数据的过滤?

2024-05-15 16:59:17 330

原创 大数据最新1(4),2024年最新正在准备面试

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!首先我们知道这个函数需要返回一个整型变量,也就是它的长度,其次我们要知道这条链表的头节点,来确定出整条链表,最后我们要知道,链表的长度,不包括头结点,链表的最后一个结

2024-05-15 16:58:44 267

原创 大数据最全【HTML基础篇002】HTML之form表单超详解_html form表单(2),2024年最新全套教学资料

Datetime:选取时间、日、月、年(以上大数据知识点,真正体系化!Time:选取时间(小时和分钟)Date:选取日、月、年。Month:选取月、年。Week:选取周、年。

2024-05-15 14:13:43 373

原创 大数据最全【Hadoop大数据技术】——HDFS分布式文件系统(1),掌握这个提升路径

NameNodeDataNode:HDFS在运行期间,将NameNode和每个DataNode之间建立一种心跳机制,NameNode在固定间隔时间内接收到DataNode发送的心跳信息,认为该DataNode处于存活状态,反之则认为该DataNode处于假死状态。在最大间隔时间内仍然没有接收到处于假死状态的DataNode发送的心跳信息,NameNode会认为该DataNode处于宕机状态。当某个DataNode处于宕机状态之后,可能会造成某些Block的副本数无法达到系统要求。

2024-05-15 14:13:11 977

原创 大数据最全【Hadoop】(二)Hadoop 分布式安装一,2024年最新2024年网易大数据开发岗面试必问

export HADOOP_HOME=/usr/local/softwave/hadoop-2.7.3 (注意这里改成自己配置文件的路径)默认文件系统(本地默认 file:/位置)此处端口与HBASE端口设成一样-->// 副本个数,最少3个伪分布只写1个)//设置映射化简模型框架为yarn。//yarn站点名称。---------内容---------------临时文件的地址-->可访问的用户组-->//这里伪分布式 直接localhost。//完全分布式则添加我另外两台从机名。

2024-05-15 14:12:38 686

原创 大数据最全【Hadoop】一、Apache Hadoop、 HDFS,2024年最新带你彻底弄明白

Hadoop集群启动Web UI页面错误1:运行hadoop3官方自带mr示例出错。Hadoop集群启停shell脚本一键启停HDFS集群YARN集群。

2024-05-15 14:12:04 653

原创 一文速学数模-时序预测模型(一)灰色预测一文详解+Python实例代码_灰色关联度时序预测(1)

博主参与过大大小小十次数学建模比赛,也获得了不少建模奖项。对于一些小批量样本数据去做预测或者是评估其规律性的话,比较适合的模型一般都是选择灰色预测模型。该模型解释性强而且易于理解,建模手段也比较简单。在一些不确定是否存在相关标量或者是存在位置特征的时候,用灰色预测模型尤为明显,牵扯太多变量时候可以以量曾量减的方式显现其变化规律,是建模比较好用的算法和思路。但是首先我们要明白该模型的使用场景以及优缺点才能更好的解释建模的效果。故为接下来的美赛,我将把一些常用建模的模型和代码补上。

2024-05-15 05:43:47 874

原创 一文速学-最小二乘法曲线拟合算法详解+项目代码_origin最小二乘法拟合

我们将残差的平方和最小的原则称为最小二乘原则。按照最小二乘原则选取拟合曲线的方法,称为最小二乘法。

2024-05-15 05:43:10 881

原创 一文速学-最小二乘法曲线拟合算法详解+项目代码_origin最小二乘法拟合(1)

我们知道一般都是从多个点来画出直线,那么如果点的排列并非能够用一条直线来拟合,但是又需要找到这样一条线来拟合多个坐标轴上面的点,那么一般都是采用曲线进行拟合。但是如何在众多密集且离散的分布点中找到一条曲线来尽可能多的去拟合多个点呢?这就需要我们采取相应的算法或者策略。我们需要使这条直线到各个数据点之间的误差最小且更可能的逼近,那么宏观来看该算法应该是全局最优算法,所以根据此我们使用最小二乘法来拟合离散的点尽可能使这些数据点均在离此曲线的上方或下方不远处。

2024-05-15 05:42:34 1097

原创 一文速学-XGBoost模型算法原理以及实现+Python项目实战_xgboost金融领域模型实战

集成模型Boosting补完计划第三期了,之前我们已经详细描述了AdaBoost算法模型和GBDT原理以及实践。通过这两类算法就可以明白Boosting算法的核心思想以及基本的运行计算框架,余下几种Boosting算法都是在前者的算法之上改良得到,尤其是以GBDT算法为基础改进衍生出的三种Boosting算法:XGBoost、LightGBM、CatBoost。

2024-05-15 05:41:57 811

原创 [SSD固态硬盘保养 1] 电脑优化设置,告别卡顿,享受顺畅 (独门 11 招)_关闭设备上的windows写入高速缓存缓冲区刷新(1)

固态硬盘(简称SSD)已经是电脑新机标配。新机SSD速度非常顺畅,但朋友们都有这种感受,使用久了,就变卡顿了。想让你的SSD性能的稳定吗?收下我送你的日常保养大礼包。

2024-05-14 21:02:57 1220

原创 [hadoop全分布部署]虚拟机Hadoop集群配置 etc hosts、配置无密码登录(SSH)_hadoop免密登录配置过程

第一台虚拟机第二台虚拟机第三台虚拟机。

2024-05-14 21:02:18 698

原创 [hadoop全分布部署]虚拟机Hadoop集群配置 etc hosts、配置无密码登录(SSH)_hadoop免密登录配置过程(3)

第一台虚拟机第二台虚拟机第三台虚拟机。

2024-05-14 21:01:43 634

原创 [hadoop全分布部署]虚拟机Hadoop集群配置 etc hosts、配置无密码登录(SSH)_hadoop免密登录配置过程(2)

第一台虚拟机第二台虚拟机第三台虚拟机。

2024-05-14 21:01:06 989

原创 2024年最新大数据分析-零基础学Tableau+超详细讲解+示例练习(二),2024年最新大数据开发程序设计基础教程

Tableau绘制折线图在这里可以调整坐标轴和刻度线我们可以发现,现在的数值显示过多,如何让其精简的显示?为了更直观的观察最大值,我们可以对顶点进行标记调整出我们想要的标签值生成带标记、单位精简的折线图,可以看到随着年份增长,2015年达到一个峰值,随之下降,到2018年达到最大值,为了对比我们可以绘制相应的双轴图:Tableau绘制饼图与环形图。

2024-05-14 11:43:41 459

原创 2024年最新大数据分析-零基础学Tableau+超详细讲解+示例练习(七),2024年最新一文全懂

戳这里获取](https://bbs.csdn.net/topics/618545628)**可以看到上述的数据其实完全可以组合在一起,我们可以通过分组的方式将他们组合在一起。Tableau 默认带了对字段的数据分层,例如日期,可以分成年、月、日,可通过列不断进行展开,层级是不可以进行嵌套的,两个层级不能放在一起。首先点击背景图像,加载进香港地铁背景图,根据图片像素进行图像设置。数据集:集是满足某些条件的数据子集,是维度的部分成员。可以对集内外和集内部成员进行对比分析。可以通过管理地图改变我们的背景地图。

2024-05-14 11:43:05 352

原创 2024年最新大数据入门-大数据是什么,腾讯架构师深入讲解大数据开发开发

大数据由于体量不断加大,单位数据的价值密 度在不断降低,然而数据的整体价值在提高。大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。**什么叫大的数据,首先数据量大,种类多,增长快,价值密度低,需要分析处理得出有价值的数据。例如微信,淘宝等网站的数据,全球几十亿人的数据都要处理。Velocity:表示大数据的数据产生、处理和分析的速度在持续加快。

2024-05-14 11:42:29 413

原创 2024年最新大数据入门-大数据技术概述(二)(1),大佬带你看源码

Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志、访问日志,消息服务等等,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;一致性、可靠性、实时性、等待无关、原子性、顺序性。

2024-05-14 11:41:53 375

原创 2024年手撕前端面试题【javascript~模板字符串、类继承、参数解析器(2),阿里、百度等大厂技术面试题汇总

除此之外,还有很多方法,例如 正则提取数据把参数从url中拆解出来,构造一个空对象去承接。

2024-05-14 03:04:25 917

原创 2024年手把手教你用UNet做医学图像分割系统_unet医学图像分割(1),面试要掌握这几个关键点

论文地址:https://arxiv.org/pdf/1505.04597.pdfU-Net原理分析与代码解读 - 知乎 (zhihu.com)Unet 发表于 2015 年,属于 FCN 的一种变体。Unet 的初衷是为了解决生物医学图像方面的问题,由于效果确实很好后来也被广泛的应用在语义分割的各个方向,比如卫星图像分割,工业瑕疵检测等。Unet 跟 FCN 都是 Encoder-Decoder 结构,结构简单但很有效。Encoder 负责特征提取,你可以将自己熟悉的各种特征提取网络放在这个位置。

2024-05-14 03:03:49 1488

原创 2024年我的高考经历与总结(2),2024年最新太现实了

【代码】2024年我的高考经历与总结(2),2024年最新太现实了。

2024-05-14 03:03:13 308

原创 2024年我与 CSDN 的 2024 年终总结_年终总结 csdn(1),2024年最新大数据开发程序基础教程

这些都是我与 CSDN 的成长见证2022年我也花了很多时间在搭建、维护、更新和优化自己的网站(有两个:和),第一个网站用的 Hexo 框架中的 Butterfly 主题,第二个网站用的是 WordPress 模板里的子比主题。一路上也是遇到了许多问题和困难,不过好在也都一一解决了。除了维护网站,我其他的大部分时间都花在了更新文章(主要还是在CSDN、掘金)。还有一部分时间花在了学习,主要是在哔哩哔哩上浏览一些免费的课程,当然还有牛客上一些大佬分享的技术。

2024-05-14 03:02:37 586

原创 2024年大数据最全VMware14安装CentOS7的详细教程,快来收藏

磁盘容量暂时分配100G即可后期可以随时增加,不要勾选立即分配所有磁盘,否则虚拟机会将100G直接分配给CentOS,会导致宿主机所剩硬盘容量减少。先选择CD/DVD,再选择使用ISO映像文件,最后选择浏览找到下载好的镜像文件。这里选择之后安装的操作系统,正确的选择会让vm tools更好的兼容。首先要打开网卡,然后查看是否能获取到IP地址(我这里是桥接),再更改主机名后点击Done。选择安装过程中使用的语言,这里选择英文、键盘选择美式键盘。如下图所示,点击加号,选择/boot,给boot分区分200M。

2024-05-13 18:17:50 789

原创 2024年大数据最全ubuntu安装hodoop详细步骤_ubuntu安装hadoop(2),2024年最新中高级大数据开发大厂高频面试题

sudo tar -zxf /home/hadoop/下载/hadoop-3.3.6.tar.gz -C /usr/local。

2024-05-13 18:17:14 240

原创 2024年大数据最全TensorFlow2 手把手教你实现前向传播_tensorflow改写forward(1),2024年最新2024最新大数据开发大厂面试真题大全

激活函数有 sigmoid, maxout, relu 等等函数. 通过激活函数我们可以使得各个层之间达成非线性关系.函数是讲 input 准换为 one_hot 类型数据输出. 相当于将多个数值联合放在一起作为多个相同类型的向量.激活函数可以帮助我们提高模型健壮性, 提高非线性表达能力, 缓解梯度消失问题.可以帮助我们实现张量自减.

2024-05-13 18:16:38 267

原创 2024年大数据最全TensorFlow2 一小时学会全连接层_tensorflow2 keras全连接(1),2024年最新阿里大数据开发研发岗二面

全链接层 (Fully Connected Layer) 会把一个特质空间线性变换到另一个特质空间, 在整个网络中起到分类器的作用.

2024-05-13 18:16:02 329

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除