自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(156)
  • 收藏
  • 关注

原创 阿卡姆大数据科普报告——Calcite(1)

所以如果你有一些存储下来的数据希望通过SQL访问它,首先需要定义一个自定义表或是schema,然后再去定义一些能使数据访问高效的规则。是通用格式,包含了一个自定义表org.apache.calcite.adapter.csv.CsvTableFactory,这个类实现了。和它对应的文件),同时也提供给了开发者更多的控制选项(例如,为每一个table提供不同参数)。)有,例如,有100列和100万行数据,你肯定希望用户在每次查询过程中不检索全量数据。)实现和查询都没有问题,因为我们的表中并没有大量的数据。

2024-05-01 16:09:11 499

原创 问题解决:java运行HiveQL,报错:java

【代码】问题解决:java运行HiveQL,报错:java。

2024-05-01 16:08:06 17

原创 问题解决:java运行HiveQL,报错:java(1)

【代码】问题解决:java运行HiveQL,报错:java(1)

2024-05-01 16:07:04 36

原创 问我大数据怎么入门,我总结了亲身体验的学习路线推荐给她【推荐收藏】_狂神大数据

基础班的配套资料虚拟机已经更新到公众号了,关注后自行获取即可。

2024-05-01 16:06:33 464

原创 大数据StarRocks(四) :常用命令_dbeaver连接starrocks

如果不指定 user_identity,则当前用户为 ‘username’@‘ip’,这个当前用户,可能无法匹配任何 user_identity。目前,StarRocks 支持原生密码、mysql_native_password 和 LDAP 三种认证方式,其中,原生密码与 mysql_native_password 认证方式的内在逻辑相同,仅在具体设置语法上有轻微差别。示例六:创建一个允许从 ‘192.168’ 子网登录的用户,同时指定其默认角色为 db_admin 和 user_admin。

2024-05-01 02:32:22 400

原创 大数据StarRocks(二) StarRocks集群部署_starrocks 资源评估

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

2024-05-01 02:31:19 219

原创 大数据StarRocks(九):资源隔离实战_starrocks资源组

以上实战足以证明mem_limit是基础的内存限制,而big_query_mem_limit是对查询内存进行进一步限制,若big_query_mem_limit和mem_limit相等,big_query_mem_limit设置限制相当于无效;因此big_query_mem_limit小于mem_limit时,对大内存查询进一步限制才有意义。系统将会根据所有分类器中设置的条件,为每个查询任务选择一个匹配度最高的分类器,并根据生效的分类器所属的资源组为该查询任务分配资源。创建资源组,关联分类器,并分配资源。

2024-05-01 02:30:48 619

原创 大数据StarRocks(九):资源隔离实战_starrocks资源组(1)

系统在为查询任务匹配分类器时,查询任务的信息与分类器的条件完全相同,才能视为匹配。如果存在多个分类器的条件与查询任务完全匹配,则需要计算不同分类器的匹配度。系统将会根据所有分类器中设置的条件,为每个查询任务选择一个匹配度最高的分类器,并根据生效的分类器所属的资源组为该查询任务分配资源。您可以修改资源组的配额,以及增加或删除资源组的分类器。创建资源组,关联分类器,并分配资源。查询和当前用户匹配的资源组和分类器。为已有的资源组修改资源配额。查询所有的资源组和分类器。查询指定的资源组和分类器。

2024-05-01 02:30:18 485

原创 一篇文章搞懂数据仓库:三种事实表(设计原则,设计方法、对比)

在 Kimball 的维度建模中,通常按照星形模型的方式设计,通过事实表的外键关联专门的维表,这种方式来获取维度,谨慎使用退化维表;订单支付金额和订单票数,两个事实的粒度为 “订单级”,属于上一层订单级数据,与 “票级” 事实表的粒度不一致,且不能进行汇总;如,淘宝订单 “付款事务事实表” 中,粒度为 “子订单”,相关的维度有买家、卖家、商品、收货人信息、业务类型、订单时间等;如,订单金额、订单优惠金额、订单运费这 3 个事实,应该采用统一的计量单位,统一为元或者分,以方便使用;

2024-04-30 15:39:23 516

原创 一篇文章搞定一个大数据组件:kudu知识点全集

由于所有插入的数据都是先写入memRowSet,到达一定条件后再写入DiskRowSet,而且DiskRowSet中的basedata是不变的,这就导致会出现数据重叠的现象,导致写或查询时需要搜索大量的DiskRowSet。4、Kudu在MemRowset中写入一行新数据,在MemRowset数据达到一定大小时,MemRowset将数据落盘,并生成一个diskrowset用于持久化数据,还生成一个memrowset继续接收新数据的请求。MemRowSet flush下来的数据,按列存储,按主键有序。

2024-04-30 15:38:20 553

原创 一种用于保证多方子系统数据一致性的方法_调用第三方接口保证数据一致性

目前我司的物联网平台是基于云原生架构的,目前主要用来对接第三方弱电子系统,比如海康ISC、大华ICC等。弱电子系统会提供人员、空间等开放接口,物联网平台通过调用开放平台的增删改接口,将我方数据同步到多个弱电子系统中。由于这多方系统都是独立的系统,具有独立的事务,当其中某个子系统发生异常后,前面调用的子系统并无感知,于是造成子系统产生脏数据,并且导致该类数据无法再次处理成功。比如我方物联网平台同时对接了海康ISC、魔点门禁系统、富士停车系统,要使用这三方系统,需要先添加人员。

2024-04-30 15:37:49 634

原创 一看就懂的大数据排序算法:如何给100万用户数据排序?

看图说话啊。桶排序的时间复杂度,是O(n),如果不出意外的话。如果要排序的数据有 n 个,我们把它们均匀地划分到 m 个桶内,每个桶里就有 k=n/m 个元素。每个桶内部使用快速排序,时间复杂度为 O(k * logk)。m 个桶排序的时间复杂度就是 O(m * k * logk),因为 k=n/m,所以整个桶排序的时间复杂度就是 O(n*log(n/m))。当桶的个数 m 接近数据个数 n 时,log(n/m) 就是一个非常小的常量,这个时候桶排序的时间复杂度接近 O(n)。

2024-04-30 15:36:05 314

原创 【Go语言刷题篇】Go从0到入门1:输出、变量、常量

代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可。const english string = “英国”const america string = “美国”const china string = “中国”* @return bool布尔型。* @param x int整型。

2024-04-30 07:26:59 271

原创 【Go语言刷题篇】Go从0到入门1:输出、变量、常量(4)

Go语言中的值类型(int、float、bool、string、array、struct)都有对应的指针类型,如:*int、*int64、*string等。否则,返回 false。题目要求:给定两个变量a,b,判断两个变量的地址,值(a,b的地址取得)是否相等,将结果依次存入切片,并返回。3、rune是int32的别名(-231~231-1),对比byte(-128~127),可表示的字符更多。题目要求:定义三个常量来分别表示中国,英国,美国这三个国家的名称,并按照中国,英国,美国的顺序逐行打印。

2024-04-30 07:26:28 537

原创 【Go语言刷题篇】Go从0到入门1:输出、变量、常量(2)

相关知识:1、Go 语言变量名由字母、数字、下划线组成,其中首个字符不能为数字。2、string,int,bool 都是基本数据类型。3、Go语言声明变量的时候为其指定初始值,格式如下:var 变量名 类型 = 表达式。4、Go语言可以使用自动判别的形式来进行快速定义即 age:=23 系统会自动判别其类型为int类型。5、定义的时候可以统一定义,如下代码块案例代码。

2024-04-30 07:25:25 166

原创 【Go语言刷题篇】Go从0到入门1:输出、变量、常量(1)

本专栏系列都采用牛客的ACM刷题模式。题目要求:已知小明的信息(姓名:小明,年龄:23,性别:男),定义三个变量,分别表示姓名(string类型),年龄(int类型),性别(男true,女false,bool类型),然后按照姓名,年龄,性别的顺序,逐行输出对应的信息。相关知识:1、Go 语言变量名由字母、数字、下划线组成,其中首个字符不能为数字。2、string,int,bool 都是基本数据类型。3、Go语言声明变量的时候为其指定初始值,格式如下:var 变量名 类型 = 表达式。

2024-04-30 07:24:54 271

原创 C语言贪食蛇小游戏教程来了,手把手教你制作一款属于自己的多彩贪吃蛇游戏_如何给自己的c语言贪吃蛇游戏加上封面

【代码】C语言贪食蛇小游戏教程来了,手把手教你制作一款属于自己的多彩贪吃蛇游戏_如何给自己的c语言贪吃蛇游戏加上封面。

2024-04-29 22:20:42 54

原创 C语言练手小项目(巩固加深知识点理解)_好玩的c语言项目

大家好,今天给大家带来的是一个C语言的练手的小项目,很多小伙伴在学完C语言一些知识点之后,不知道该如何去验证自己是否真的理解这个知识点,是否可以去运用这个知识点做一些想要进行完成的操作。到了这个时候就应该去做一些小的项目去感受一下自己的掌握的程度,下面就来介绍一下今天给大家带来的小项目。小项目的介绍。

2024-04-29 22:19:40 149

原创 C语言知识大全(一)——C语言概述,数据类型_为什么说数据在内存中的占用字节是有c语言的编译系统决定的

打印格式含义%d输出一个有符号的10进制int类型%o(字母o)输出8进制的int类型%x输出16进制的int类型,字母以小写输出%u输出一个10进制的无符号数int main()//定义变量a,以10进制方式赋值为123//定义变量b,以8进制方式赋值为0567//定义变量c,以16进制方式赋值为0xabcprintf("8进制:b = %o\n", b);printf("10进制:b = %d\n", b);printf("16进制:c = %x\n", c);

2024-04-29 22:19:09 635

原创 C语言知识大全(一)——C语言概述,数据类型_为什么说数据在内存中的占用字节是有c语言的编译系统决定的(1)

打印格式含义%d输出一个有符号的10进制int类型%o(字母o)输出8进制的int类型%x输出16进制的int类型,字母以小写输出%u输出一个10进制的无符号数int main()//定义变量a,以10进制方式赋值为123//定义变量b,以8进制方式赋值为0567//定义变量c,以16进制方式赋值为0xabcprintf("8进制:b = %o\n", b);printf("10进制:b = %d\n", b);printf("16进制:c = %x\n", c);

2024-04-29 22:18:38 732

原创 教你IDEA解决GIT冲突_idea git解决冲突

以及其他方面等等优势,那么这篇文章我重点教大家如何解决GIT冲突。

2024-04-29 02:22:33 333

原创 收藏,数据仓库建设与框架终于有人给讲明白了_建设数据仓库和数据集市(3)

来一起看个官方定义:数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。数据仓库之父 Bill Inmon 在 1991 年出版的 Building the Data Warehouse 一书中首次提出了被广为认可的数据仓库定义。

2024-04-29 02:21:31 233

原创 收藏,数据仓库建设与框架终于有人给讲明白了_建设数据仓库和数据集市(2)

数据仓库中的数据不可更新是针对应用来说的,也就是说,数据仓库的用户进行分析处理时是不进行数据更新操作的。但并不是说,在从数据集成输入数据仓库开始到最终被删除的整个数据生存周期中,所有的数据仓库数据都是永远不变的。

2024-04-29 02:20:59 367

原创 收藏!2024 年最具潜力 44 个顶级开源项目,涵盖 11 类 AI 学习框架、平台_序列大数据的智能计算 开源项目(1)

除此之外,它还结合了高性能和修补低级模型细节的能力,例如:同时使用高级 api,并使用 NVIDIA 的 CUDA 工具包实现自己的自定义操作符。该系统可从人脸中提取高质量的特征,称为人脸嵌入(face embeddings),可用于训练人脸识别系统,从而实现对人脸的验证。MLflow 是机器学习生命周期的开源平台,开放接口,可与任何机器学习库、算法、部署工具或编程语言一起使用,基于 REST API 和简单的数据格式而构建。不过和传统的分布式计算系统不同的是,Ray 使用了混合任务调度的思路,性能更强。

2024-04-29 02:18:35 484

原创 一文速学-XGBoost模型算法原理以及实现+Python项目实战_xgboost金融领域模型实战

集成模型Boosting补完计划第三期了,之前我们已经详细描述了AdaBoost算法模型和GBDT原理以及实践。通过这两类算法就可以明白Boosting算法的核心思想以及基本的运行计算框架,余下几种Boosting算法都是在前者的算法之上改良得到,尤其是以GBDT算法为基础改进衍生出的三种Boosting算法:XGBoost、LightGBM、CatBoost。

2024-04-28 13:05:15 777

原创 一文透析 Spring Boot、微服务架构和大数据治理三者之间的故事(1)

Spring Boot 本身发展特别快,自从 2014 年 4 月发布 Spring Boot 1.0 之后,版本更新非常频繁,我在 2016 年使用的时候是 1.3.X,到现在 Spring Boot 已经发布了 Spring Boot 2.0,Spring Boot 2.0 集成了很多最新优秀的技术和新特性,并且对 Spring Boot 1.0 的 API 进行了大幅优化。在微服务架构中我们强调彻底的组件化和服务化,每个微服务都可以独立的部署和投产,其实也就意味着很多的微服务有自己独立的数据库。

2024-04-28 13:04:12 660

原创 一文读懂 Spring Boot、微服务架构和大数据治理三者之间的故事

Spring Boot 本身发展特别快,自从 2014 年 4 月发布 Spring Boot 1.0 之后,版本更新非常频繁,我在 2016 年使用的时候是 1.3.X,到现在 Spring Boot 已经发布了 Spring Boot 2.0,Spring Boot 2.0 集成了很多最新优秀的技术和新特性,并且对 Spring Boot 1.0 的 API 进行了大幅优化。Spring Boot 使编码变简单,Spring Boot 提供了丰富的解决方案,快速集成各种解决方案提升开发效率。

2024-04-28 13:03:41 638

原创 一文教你数据结构体栈和队列的实现_结构体队列

QNode;//队列要有一个头//队列要有一个尾int size;}Queue;

2024-04-28 13:02:36 293

原创 【SQL屠夫系列】leetcode-180(1)

其实这时候你得考虑下使用窗口函数row_number() over,数据开发人员用的多一般会自然而然想到,但对于非大数据开发人员,可能接触的一些数据库本身就不支持row_number() over…使用原始数据另一维度排序,这些num值一样的分组排序,然后对其编号同样使用row_number() over(表达式),参数:(num分组,id排序)row_number() over(partition by num order by id)要获取至少连续三次出现的数字,不能强力破解,如果是至少连续出现四次?

2024-04-28 08:01:55 300

原创 【SQL Server】数据库开发指南(二)MSSQL数据库开发对于库、表

name = ‘demoTest_data’, --主数据文件的逻辑名。fileName = ‘c:\demoTest_data.mdf’, --主数据文件的物理名。fileName = ‘c:\demoTest2_data.mdf’, --主数据文件的物理名。insert into classes values(‘2班’, ‘2011-06-15’);(img-RzWN5LAA-1714262465305)]----- 多个列、约束一起创建--------

2024-04-28 08:01:25 892

原创 【SPSS】多因素方差分析详细操作教程(附案例实战)_使用spss软件进行多因素方差分析(1)

上述问题的研究就可以通过方差分析实现。在方差分析中,上述问题中的农作物产量称为观测因素(观测变量);品种、施肥量等影响因素称为控制因素(控制变量);将控制变量的不同类别(如 甲品种、乙品种、丙品种;10千克化肥、20千克化肥、30千克化 肥)称为控制变量的不同水平。基于上述两个基本假设,方差分析对各总体分布是否有显著差异的推断就转化成对各总体均值是否存在显著差异的推断。

2024-04-28 07:59:41 618

原创 【Spark深入学习 -14】Spark应用经验与程序调优

机器硬件(如磁盘的选择,SATA盘还是SAS盘,磁盘RAID方式等)、网络(千兆网卡还是万兆网卡,网络峰值期间的带宽、吞吐、网络延迟、网络抖动,很多时候网络问题导致各种莫名问题,举个真实的例子,公司网线被老鼠咬了,导致网络时而可以,时而不行,鬼知道是什么问题,让人抓狂)、操作系统(操作系统的稳定性,内核版本的选择,非常重要,还有一些配置策略得和hadoop生态吻合)。可以看出来,一共有2个stage,1个stage包含8个task,一个包含2个task,先跑8个的,再跑2个的,一个14秒,一个0.1秒。

2024-04-28 07:59:10 653

原创 C语言贪食蛇小游戏教程来了,手把手教你制作一款属于自己的多彩贪吃蛇游戏_如何给自己的c语言贪吃蛇游戏加上封面(2)

【代码】C语言贪食蛇小游戏教程来了,手把手教你制作一款属于自己的多彩贪吃蛇游戏_如何给自己的c语言贪吃蛇游戏加上封面(2)

2024-04-27 22:15:31 292

原创 C语言设计模式:实现简单工厂模式和工程创建_数据工厂c语言(1)

/person.c文件中的该函数将person相关全局的结构体加到链表中。struct Animal* putCatInLink(struct Animal *phead) //头插法,会改变头,所以用到指针。if(phead == NULL){ //如果头为空,那就返回cat为链表头。//cat.c文件中的该函数将cat相关全局的结构体加到链表中。//dog.c文件中的该函数将dog相关全局的结构体加到链表中。printf(“猫吃鱼\n”);printf(“猫吃鱼\n”);

2024-04-27 22:13:49 564

原创 C语言练手小项目(巩固加深知识点理解)_好玩的c语言项目

大家好,今天给大家带来的是一个C语言的练手的小项目,很多小伙伴在学完C语言一些知识点之后,不知道该如何去验证自己是否真的理解这个知识点,是否可以去运用这个知识点做一些想要进行完成的操作。到了这个时候就应该去做一些小的项目去感受一下自己的掌握的程度,下面就来介绍一下今天给大家带来的小项目。小项目的介绍。

2024-04-27 22:13:18 228

原创 C语言知识大全(一)——C语言概述,数据类型_为什么说数据在内存中的占用字节是有c语言的编译系统决定的

打印格式含义%d输出一个有符号的10进制int类型%o(字母o)输出8进制的int类型%x输出16进制的int类型,字母以小写输出%u输出一个10进制的无符号数int main()//定义变量a,以10进制方式赋值为123//定义变量b,以8进制方式赋值为0567//定义变量c,以16进制方式赋值为0xabcprintf("8进制:b = %o\n", b);printf("10进制:b = %d\n", b);printf("16进制:c = %x\n", c);

2024-04-27 22:12:14 877

原创 百度T7大牛强烈推荐学习的230页Elasticsearch大数据搜索引擎

默认Elasticsearch是使用Netty作为HTTP的容器的,由于Netty并没有权限模块,所以默认Es没有任何的权限控制,直接通过HTTP就可以进行任何操作,除非把HTTP禁用。用例子说明了Java、Python、 Scala 和PHP的编程API,其中在Java搜索界面实现上,介绍了使用Spring实现微服务开发。第1章介绍了如何使用elasticsearch,在信息时代,可供获取的数据加速涌现,我们可以通过搜索引擎来挖掘大数据的价值,百度就是一个大的数据搜索引擎。

2024-04-27 15:55:06 311

原创 百度T7大牛强烈推荐学习的230页Elasticsearch大数据搜索引擎(1)

默认Elasticsearch是使用Netty作为HTTP的容器的,由于Netty并没有权限模块,所以默认Es没有任何的权限控制,直接通过HTTP就可以进行任何操作,除非把HTTP禁用。第1章介绍了如何使用elasticsearch,在信息时代,可供获取的数据加速涌现,我们可以通过搜索引擎来挖掘大数据的价值,百度就是一个大的数据搜索引擎。对于搜索引擎来说,返回结果的相关性是一个重要的话题, 第5章讨论了这个问题。这里首先介绍采用JSP和自定义标签实现的搜索界面,然后介绍REST架构的搜索界面。

2024-04-27 15:54:04 355

原创 电商项目前台搜索服务es实现

*** description:商品客户端*//*** 商品全部数据调用* @return*/

2024-04-27 15:52:23 401

原创 电商项目前台搜索服务es实现(2)

查询索引#全部查询“query”: {#关键字查询“query”: {“match”: {“all”: “最好”

2024-04-27 15:51:21 561

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除