自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(294)
  • 收藏
  • 关注

原创 还不懂大数据和算法?这份BAT大厂大数据、算法落地项目实战PDF你一定要看看

滴滴出行作为移动出行领域的一家领先的移动互联网企业,也正积极布局和利用智能语音交互相关技术,如语音识别、语音对话理解、语音合成等,以便更好的为司机和乘客提供高质量服务,具体地,包含有司机智能助手和滴滴智能客服系统等应用产品。从底层的机器监控到直面用户的应用,都离不开时序性的业务场景,而时序性的数据一般都由专业的时序数据库来存储分析,下面主要介绍TSDB覆盖的业务场景以及面临的挑战。智能客服是一种使用自然语言与用户交互的人工智能系统,通过分析用户意图,以人性化的方式与用户沟通,向用户提供客户服务。

2024-05-16 12:53:52 361

原创 还不懂大数据和算法?这份BAT大厂大数据、算法落地项目实战PDF你一定要看看(2)

主要包括:项目背景、兴趣图谱、内容理解、线上效果。

2024-05-16 12:53:18 378

原创 最新微人事项目代码泛读结对练习经验分享_微人事代码精读,2024年最新2024最新爱奇艺大数据开发社招面试题目

③ 组员本地只有一个分支,关联远程dev分支【可以选择clone某一个远程分支到本地】最后展示一下项目。

2024-05-16 09:12:09 769

原创 最新开源 SPL 消灭数以万计的数据库中间表_开源spl(3),通过五轮面试斩获offer阿里实习生亲述

中间表是数据库中专门存放中间计算结果的数据表,往往是为了前端查询统计更快或更方便而在数据库中建立的汇总表,由于是由原始数据加工而成的中间结果,因此被称为中间表。在某些大型机构中,多年积累出来中间表的数量居然高达数万张,给系统和使用造成了很多麻烦。中间表会占用大量的数据库存储空间导致数据库容量不足,面临扩容压力。数据库的空间往往很贵,扩容成本非常高,并且数据库扩容还常常存在限制,耗费高昂成本来存储中间表并不是个好办法。

2024-05-16 09:11:36 329

原创 最全Doris使用总结_doris 客户端工具,2024金九银十面试季

bdbje(BerkekeyDB Java Edition),负责元数据操作日志的持久化、FE 高可用等功能。

2024-05-16 01:23:47 540

原创 最全Docker容器与虚拟化技术:OpenEuler 部署 ES 与 Kibana,程序员面试题网站

使用镜像elasticsearch:7.8.0,以后台模式启动一个容器,将容器的 9200 端口映射到主机的 19200 端口,主机的配置文件/data/elasticsearch/config/elasticsearch.yml映射到容器的配置文件/usr/share/elasticsearch/config/elasticsearch.yml,主机的相关目录映射到容器的相关目录。进入容器中找到/usr/share/kibana/config/kibana.yml。(2)启动Kibana。

2024-05-16 01:23:14 573

原创 大数据最全牛客网《剑指offer》专栏刷题练习之二叉树合集_剑指offer 牛客网,2024年最新成体系化的神级大数据开发进阶笔记

但是如果相同的方式进行两次,可行但我们不去做,这对时间的消耗太多了,我们不如在遍历的过程就结果比较了。前序遍历的时候我们采用的是“根左右”的遍历次序,如果这棵二叉树是对称的,即相应的左右节点交换位置完全没有问题;那我们是不是可以尝试“根右左”遍历,按照轴对称图像的性质,这两种次序的遍历结果应该是一样的。据知识点,真正体系化!

2024-05-15 16:36:33 276

原创 大数据最全深度学习(四)—— 常见的损失函数_距离图损失函数(1),彻底帮你搞懂

其中,y 是样本 x 属于某一个类别的真实概率(onehot编码,0或者1),而 f(x) 是样本属于某一类别的预测分数,S 是 softmax 函数,L 用来衡量 p,q 之间差异性的损失结果。其中,y是样本x属于某一个类别的真实概率,而y^是样本属于某一类别的预测概率,L用来衡量真实值与预测值之间差异性的损失结果。L1 loss 的最大问题是梯度在零点不平滑(不可导),导致会跳过极小值。特点是:由于 L1 loss 具有稀疏性,为了惩罚较大的值,因此常常。在深度学习的分类任务中使用最多的是。

2024-05-15 16:35:59 349

原创 大数据最全深度学习(初识tensorflow2,2024年最新大数据开发面试大数据开发基础

因为问题比较简单,隐藏层我们只设计了一层,其中有3个节点n1、n2、n3,分别对3个输入的分数进行处理,处理的方式就是分别乘以3个权重w1、w2、w3。一般是神经网络模型的最后一层,会包含1个或多个以菱形表示的输出节点,输出节点代表着整个神经网络计算的最后结果:输出层的节点一般习惯上用y来命名,但并非必须。标记该节点所做的计算,例如,x1、x2、x3、n1、n2、n3、y都是节点名称,“*w1”、 “*w2”、 “*w3”这些都代表节点运算。这里我们进行了真正意义上的的计算,sess.run函数的。

2024-05-15 16:35:25 294

原创 大数据最全Win10安装Hadoop3(1),2024年最新大数据开发面试相关文章及Github学习资料

识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。三、配置Hadoop。

2024-05-15 13:50:31 223

原创 大数据最全UML类图的六大关系,最佳学习理解方式_uml关系(2),阿里内部大数据开发应届生就业宝典

体现的是A对象(学校)可以包含B对象(老师、学生),但B对象不是A对象的一部分。那当然也是有单向关联, 也就是学生关联多门课程, 但是课程是没法主动关联学生的。好比如,学生和老师之间的关联, 学生关联多个老师,老师也可以管理多个学生。凤凰没了, 它的翅膀也是相当于没了。类跟类之间的继承关系,大家肯定不陌生,父子关系,子继承父。老师、学生,如果学校不存在了,他们还是可以单独存在。关联关系,显然就是存在 类和类之间都有关联,那就是。类跟接口之间的实现关系,大家肯定也不陌生。其实,还有自己关联自己,自关联。

2024-05-15 13:49:25 326

原创 大数据最全tp6的运行流程+一个完整的tp6请求的流程:_tp6(2),大数据开发开发技术总结

了解tp6的运行流程+一个完整的tp6请求的流程。

2024-05-15 13:48:53 360

原创 一个案例教会你python中random的使用技巧_一组参数随机其余不变python代码(1)

可以看到当seed()没有参数时,每次生成的随机数是不一样的,而当seed()有参数时,每次生成的随机数是一样的,同时选择不同的参数生成的随机数也不一样.

2024-05-15 05:18:10 844

原创 一个前端对七个后端?别说难,你可能连工作都找不到_一个前端配几个后端

在知乎上看到个问题:为什么 211/985 毕业的前端工程师那么难招?下面有个评论很有意思:工程师A说我是211的,工程师B说我是985的,工程师C说我996的,玩笑中又带有点心酸。在这内卷又压力的环境下,还是得夯实技术,提升个人竞争力,找出突破口。

2024-05-15 05:17:34 626

原创 一个前端对七个后端?别说难,你可能连工作都找不到_一个前端配几个后端(1)

当前Web前端开发的边界在不断得到拓展,因此当前的Web前端开发也被称为“大前端”,所以Web前端开发人员要尽量掌握更全面的前端开发知识,既需要掌握Web前端开发知识,也需要掌握各种移动端开发知识。从行业发展趋势来看,移动端未来的任务量依然比较大。当前整个开发领域正在向平台化方向发展,目前云计算平台和大数据平台已经逐渐开始落地应用。所以Web前端开发人员要想提升自身的开发能力和开发边界,一定要注重开发平台知识的累积。当前可以重点关注一下PaaS相关知识,目前行业领域对于PaaS的发展前景还是比较看好的。

2024-05-15 05:16:58 829

原创 一个初学编程的草根大叔用了一个月时间冲上周榜第二名!给想冲榜的后浪们谈谈小经验——

另外,题图和插图放些美图啥的(稍微加点料,只要不过界就行,你懂的),用官方博客的原话来说就是:既学到了知识,又分泌出了荷尔蒙,焉能不去互动一下?呕心沥血,袒露心声,掏心掏肺”的文章点击率高过8%,而标题起类似“某某语言从入门到精通、某某接口的用法和实例详解、某某语言学习笔记、超详细的某某操作系统常用命令锦集”此类的文章平均点击率小于4%。可见标题是什么很重要,在标题党盛行的时代,在别的平台的作者为一个好标题绞尽脑汁的时代,我们的一些作者仍然存着“酒香不怕巷子深”的想法,颇有些“不知有汉,无论魏晋”的感觉!

2024-05-15 05:16:22 596

原创 VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vmware安装hadoop教程

为了这三个节点间免密登录,比如后面在启动hadoop服务时,主节点启动其它从节点,就需要免密去执行。搭建集群需要3个虚拟机,hadoop01,hadoop02,hadoop03,已经安装了hadoop01,剩下两个需要用到虚拟机克隆。下载一个linux版本的JDK,这里是 jdk-8u161-linux-x64.tar.gz,3台机器均要执行以下。hadoop02、hadoop03修改时,把对于域名修改成hadoop02、hadoop03即可。同理,克隆出hadoop03即可,到这虚拟机创建及配置完毕。

2024-05-14 20:37:13 849

原创 VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vmware安装hadoop教程(3)

选择VMnet8之后点击确定即可。

2024-05-14 20:36:37 907

原创 VMware搭建Hadoop集群 for Windows(完整详细,实测可用)_vmware安装hadoop教程(1)

SSH服务的作用一般是有两方面:一是便于虚拟机节点之间免密访问,二是传输数据时会有加解密的过程安全性更高。为了这三个节点间免密登录,比如后面在启动hadoop服务时,主节点启动其它从节点,就需要免密去执行。下载一个linux版本的JDK,这里是 jdk-8u161-linux-x64.tar.gz,3台机器均要执行以下。hadoop02、hadoop03修改时,把对于域名修改成hadoop02、hadoop03即可。这里我们需要借助ftcp文件传输软件,这里使用的是**MobaxTerm,*

2024-05-14 20:35:23 867

原创 2024年最新使用SQL语句创建数据库与创建表_数据库建表(2),深度解读Netty

数据库分离:数据库分离是指将数据库文件从数据库服务器实例中分离出来,相当于关闭了数据库。将刚刚创建的数据库Student_info 数据文件的初始值大小 改为30MB, 最大值 改为500MB, 数据增长量 改为5%, 日志文件初始值 改为20MB, 最大值 改为60MB, 数据增长量 为6%.管理,如果我们想要自己创建的数据库在别的客户端,或者说是让别人在它的电脑上也能使用,我们就需要对数据库分离,然后找到被分离的数据库文件.mdf(数据文件),和.ldf(日志文件)

2024-05-14 11:18:03 286

原创 2024年最新使用Spark操作Hudi表详细教程_spark sql操作hudi,裸辞奋战25天三面美团

【代码】2024年最新使用Spark操作Hudi表详细教程_spark sql操作hudi,裸辞奋战25天三面美团。

2024-05-14 11:17:27 332

原创 2024年最新使用flink的standalone模式同步Kafka的数据到clickhouse,2024年最新【大牛系列教学

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!}package com.kszx;import com.kszx.Mail;import org.apache.flink.configuration.Con

2024-05-14 11:16:51 268

原创 2024年最新你敢信?冰河的《海量数据处理与大数据技术实战》免费送!,2024年最新大数据开发都没弄明白凭什么拿高薪

分别介绍了每种框架的基本原理和使用案例,包括:搭建每种框架的运行环境,Flume基于内存、文件和目录的Channel,Flume写数据到HDFS和Kafka,Flume采集Nginx日志到Hive、Flume采集Nginx日志到多个目标系统,自定义Flume的Agent,Flume监控,分别使用Java语言和Python语言实现Kafka客户端编程,使用Storm实现单词计数、追加字符串、聚合多种数据流、实现分组聚合和实现事务处理,实现Storm监控等。且后续会持续更新**

2024-05-14 11:16:15 256

原创 2024年大数据集群搭建之Linux安装Hive2(3),2024年最新大数据开发开发社招面试经验

一、安装准备二、解压Hive三、环境变量配置。

2024-05-14 02:38:47 938

原创 2024年大数据量Excel导出优化,2024年百度大数据开发面试真题

因为SXSSFWorkbook这种方式是将数据写入临时文件,而不是保存在内存中。基于EasyExcel和线程池解决。

2024-05-14 02:38:11 144

原创 2024年大数据进阶之路——Spark SQL基本配置_spark(1),2024年最新大数据开发framework面试题

>

2024-05-14 02:37:35 234

原创 2024年大数据赋能电竞出海企业发展,2024年最新太厉害了

在当今电竞世界中,电子竞技的大数据可以用在多个方面,从自身来说:可以用来分析自己的强势点,可以分析对手的弱点,从而运用更好的策略来战胜对手。产品线很丰富,除了传统的强项足球,还增加了篮球、网球、美式足球甚至赛车等,还有近几年非常火热的电竞比赛数据,覆盖了所有主流的电竞游戏。电竞数据包含的内容有很多,比如说基础数据(实时比分,关键事件,赛后数据等等),统计数据(阵容分析,选手分析,地图分析等),还有资料库数据(赛事战队,赛程赛果,赛况榜单等等),众多的数据组合而成形成如今的电竞大数据。

2024-05-14 02:36:57 426

原创 2024年大数据最全Nasu Elasticsearch Charts:轻松实现数据可视化的利器(1),2024年最新面试必备知识点

随着信息时代的到来,数据已经成为企业决策的关键因素之一。Elasticsearch作为一种强大的搜索和分析引擎,为用户提供了快速、实时的数据检索和分析能力。在众多Elastic Stack组件中,图表可视化工具则是将数据呈现得直观、清晰的关键环节。本文将深入探讨Nasu Elasticsearch Charts 图表可视化工具的使用,帮助读者更好地理解和应用这一工具。

2024-05-13 17:52:08 319

原创 2024年大数据最全Mysql----查看数据库,表占用磁盘大小_数据库占用磁盘空间(1),2024年最新上岸蚂蚁金服

【代码】2024年大数据最全Mysql----查看数据库,表占用磁盘大小_数据库占用磁盘空间(1),2024年最新上岸蚂蚁金服。

2024-05-13 17:51:32 440 1

原创 2024年大数据最全Mybatis插入大量数据效率对比:foreach、SqlSession批量、sql(2),2024年最新大数据开发黑科技保活实现原理揭秘

System.out.println(“sql 插入耗时:”+(System.currentTimeMillis()-start));System.out.println(“forEachInsert 插入开始========”);System.out.println(“batchInsert 插入开始========”);System.out.println(“xmlInsert 批量插入开始========”);System.out.println(“sql 插入开始========”);

2024-05-13 17:50:56 312

原创 2024年大数据最全MQ组件之RabbitMQ学习(1),真香定律

MQ (MessageQueue),中文是消息队列,字面来看就是存放消息的队列。也就是事件驱动架构中的Broker。下图是常见MQ组件的对比。下图是RabbitMQ管理后台的预览页面,展示了RabbitMQ节点的相关信息,如节点的名字、状态、运行时间等下图Connections(连接)页面,在这个页面查看、管理和关闭当前所有的TCP连接。下图是Channels(通道)页面,这里展示了所有当前打开的通道以及它们的详细信息下图是Exchanges(交换机)页面,这里可以查看、创建和删除交换机。

2024-05-13 17:50:20 543

原创 2024年Hadoop 3,【工作感悟】

Hadoop 集群包括两个集群:HDFS 集群、YARN 集群。两个集群逻辑上分离、通常物理上在一起;两个集群都是标准的主从架构集群。逻辑上分离两个集群互相之间没有依赖、互不影响物理上在一起某些角色进程往往部署在同一台物理服务器上MapReduce 集群呢?MapReduce 是计算框架、代码层面的组件,没有集群之说。

2024-05-13 12:16:32 403

原创 2024年Go基础学习笔记(一):基础语法、内建容器(1),2024年最新大数据开发驱动工程师面试题

2)使用常量定义枚举类型3)变量定义要点回顾。

2024-05-13 12:15:56 762

原创 2024年Google BigQuery 创始工程师:大数据已“死”,大数据开发开发需要学什么

所有的大数据集都是经年累月产生的。但随着时间的推移,计算的需求可能不会发生太大变化,大多数分析都是针对近期的数据进行的。很多时候,当数据仓库的客户从没有分离存储与计算的环境转移到分离的环境时,他们的存储使用量会大幅增长,但他们的计算需求往往不会改变。再举一个具体的例子,2020年~2022年,我在 SingleStore 工作,当时这是一家快速发展的公司,收入可观,而且有成为独角兽企业的潜质。他发现,他投资的最大的 B2B 公司拥有大约 1TB 的数据,而最大的 B2C 公司拥有大约 10TB 的数据。

2024-05-13 12:15:20 739

原创 2024年Git配置多个账户、Git分支拉取主干最新代码,2024年最新阿里巴巴二面被血虐

配置第二个账号注意加上–local参数来指定只在当前git项目中生效。生成ssh-t:执行密钥类型,默认是rsa,可以省略-C:设置注释文字在C:\Users\你的用户名.ssh下可以看到生成的两个文件。

2024-05-13 12:14:43 366

原创 最新Java面试题入职总线---总目录,大数据开发开发零基础

👇👉👈 ——>领取专属粉丝福利💖☝️💋专栏简介:Java攻城狮们的面试福音,全程干货,原价99.9¥,限时49.9¥🔥火爆订阅中,Java最详细面试汇总,由深到浅讲解,专栏最终文章数不低于50篇,专栏持续更新,面试官绞肉机💖博主简介:白大锅,从事Java领域多年,Java领域优质创作者、阿里云专家博主、华为云享专家,热衷Java、Js三十年💟粉丝福利:文末公众号可领取众多面试资料/简历模板/以及博主私人微信。

2024-05-12 14:55:38 790

原创 最新Java面试题入职总线---总目录(2),BTAJ大厂最新面试题汇集

会持续更新**

2024-05-12 14:55:02 368

原创 最新Java面试题入职总线---总目录(1),Alibaba高并发业务实战文档

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

2024-05-12 14:54:26 593

原创 最新java程序员的AI之路-大数据篇 hadoop安装(1),2024年最新作为一个程序员你觉得最大的悲哀是什么

在 Linux 系统中,~ 代表的是用户的主文件夹,即 “/home/用户名” 这个目录,如你的用户名为 hadoop,则 ~ 就代表 “/home/hadoop/”。这里我在/etc/profile里面也配置过,按理说应该和在~/.bashrc配置效果一样,但是在/etc/profile配置就会出现hadoop读取不到配置的异常。进入hadoop的安装路径 /usr/etc/hadoop/bin 执行hdfs namenode -format。1、首先将安装包放在/usr/etc/下面,解压。

2024-05-12 14:53:50 776

原创 最全2024面对5G、AI、大数据,Android掌握什么技术才不会被淘汰?(2),2024年最新大数据开发开发经验谈

暂且不看移动开发的出路,就按目前程序员的普遍发展,很多人会一直朝着技术专家发展,但是,很多人在还到没技术专家的时候,就半路夭折了。开发本可以转测试,转产品,转PM/项管,或者创业!如果发现你在一条路上走不通,请迅速抉择,不要过长的停留,止步不前。这样对你的职业生涯发展很不利。什么时候转?按目前程序员的年龄拓扑图,便于大家理解,我整理了下,便于你分析理解。工程师(1-2年)–高级/资深(3-5年)-专家(5-7年)–总监(8-10年)按普通开发的升级打怪路线,差不多就是这个年龄段。

2024-05-12 06:22:04 884

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除