自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

JustinMars的博客

专注于大数据和数据挖掘

  • 博客(522)
  • 资源 (2)
  • 收藏
  • 关注

原创 增强学习和蒙特卡洛树搜索算法详细解析

阿尔法狗(AlphaGo)是谷歌旗下DeepMind开发的一个著名的增强学习算法,它在围棋领域取得了显著的成就。本文主要探讨其中两个重要的算法:增强学习算法和蒙特卡洛树搜索算法。

2023-11-16 14:23:39 802

原创 人工智能:CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的知识梳理

CNN 主要用于处理图像数据,RNN 用于处理序列数据,而 DNN 是一个通用的深度神经网络架构,可以应用于各种不同类型的数据。这些神经网络架构也可以结合使用,以解决复杂的多模态问题。

2023-10-24 17:58:05 7178 6

原创 python烟花代码

python 编写烟花特效代码

2023-10-18 17:05:26 6376 3

原创 Hadoop简介之望见数据湖

1 Hadoop概述随着信息化时代的来临,数据信息呈爆炸式增长。IBM的研究称,90%的人类文明数据是近两年产生的,而到了2020年,全球产生的数据量将是今天的44倍。传统的方法已难以应对越来越多的海量数据,因此海量数据的处理方法成为研究热点。大数据技术研究与应用推动互联网产业的快速发展,同时企业也促进了大数据技术的“新陈代谢”。在国外的计算机行业,Yahoo,Linkedin,Fackbook,eBay等企业都着手搭建Hadoop平台,努力推动Hadoop技术的发展并完善Hadoop项目。在国内,随着

2020-09-28 15:09:37 2583 2

原创 Greenplum安装时修改gpssh-exkeys中SSH免密登录端口

SSH免密登录的默认端口号为22,如果需要使用2226端口,可以修改如下地方298 def testAccess(hostname):299 '''300 Ensure the proper password-less access to the remote host.301 Using ssh here also allows discovery of remote host keys *not*302 reported by ssh-keyscan.303...

2020-09-08 14:13:29 3222 2

原创 JavaScript可视化

JavaScript 提供了多种库和工具来进行数据可视化。

2024-09-24 11:00:18 79

原创 doris 如何不指定DISTRIBUTED 参数

Doris建表规则

2024-09-24 10:04:01 22

原创 apache paimon简介(官翻)

Apache Paimon 是一个专为大数据应用设计的多功能表存储系统。它支持批处理和流处理,通常与 Apache Flink、Apache Hive 和 Apache Spark 等工具一起使用。

2024-09-23 16:07:07 607

原创 apache doris部署添加be节点失败“ErrMsg: java.net.SocketTimeoutException: connect timed out“

Doris部署报错

2024-09-20 16:44:38 258

原创 Apache doris手动部署时报错“Please disable swap memory before installation.“

swap 分区是内核发现内存紧张时,会按照自己的策略将部分内存数据移动到配置的 swap 分区,由于内核策略不能充分了解应用的行为,会对数据库性能造成较大影响。不建议使用设置 vm.swappiness = 0 的方式,因为这个参数在不同的 Linux 内核版本会有不同的语义,很多情况下不能完全关闭。永久关闭,使用 Linux root 账户,注释掉 /etc/fstab 中的 swap 分区,然后重启即可彻底关闭 swap 分区。临时关闭,下次机器启动时,swap 还会被打开。关闭 swap 分区。

2024-09-20 10:29:28 302

原创 Java的泛型擦除

Java 的泛型通过类型擦除机制在编译时确保类型安全,并且在运行时移除泛型信息以保持向后兼容性。这虽然提供了类型安全的好处,但也带来了运行时类型信息丢失和其他一些限制,需要在使用泛型时小心处理。

2024-09-13 17:44:42 206

原创 ecmascript和javascript的区别

JavaScript 是 ECMAScript 的一种实现,而 ECMAScript 是 JavaScript 语言的标准。ECMAScript 作为标准不断演进,推动 JavaScript 语言的发展,JavaScript 则通过各大引擎实现这些标准,从而在各种平台和应用中被使用。

2024-09-13 13:55:07 357

原创 深度学习和机器学习的区别

机器学习和深度学习各有优势和适用场景。机器学习更适合处理结构化数据,计算资源需求较低,且具备良好的可解释性。而深度学习在大规模非结构化数据处理方面表现突出,适合复杂任务,但需要更多的计算资源和数据支持。

2024-09-13 13:51:59 383

原创 collocate join,bucket join,broadcast join,shuffle join对比分析

在实际应用中,根据数据规模、Join 类型和系统的性能需求,选择合适的 Join 策略非常关键。一般情况下,优先使用 Broadcast Join 进行小表与大表的 Join,如果数据已被分桶则选择 Bucket Join,Collocate Join 适用于提前计划好分区策略的场景,Shuffle Join 则作为通用方案用于无法优化的情况。

2024-09-12 15:41:11 272

原创 Azkaban、oozie、airflow、dolphinschduler 对比分析

Azkaban、Oozie、Airflow 和 DolphinScheduler 是四种常见的数据工作流调度工具,广泛应用于大数据和数据工程领域。

2024-09-12 15:33:17 1091

原创 实时数据湖paimon 维表点查

维表点查是数据查询中的一种操作方法,主要用于从维度表中快速获取特定行的数据。

2024-09-12 15:23:21 49

原创 Flink CEP(复杂事件处理)高级进阶

在 Flink CEP 中,模式定义是通过Pattern类来完成的。模式定义时,用户可以设置模式的开始事件、状态转换条件、次数限制等。

2024-09-11 17:22:14 512

原创 大数据之spark算子简介

在 Apache Spark 中,Transformation 和 Action 是两类核心算子,用于定义数据处理逻辑;PairRDDFunctions 提供了对键值对 RDD 的特殊操作;而 File System 处理则涉及与外部存储的交互。下面详细介绍每一部分。

2024-09-11 17:19:38 353

原创 大数据开发:可视化组件Redash安装部署

Redash 是一个开源的数据可视化和仪表盘平台,主要用于帮助团队更轻松地查询、可视化和分享数据。它支持与多种数据源的集成,如 SQL 数据库、NoSQL 数据库、API 等,用户可以通过简单的 SQL 查询来获取数据,并将结果以图表和仪表盘的形式展示。

2024-09-06 17:12:31 293

原创 docker 重启容器且修改服务映射端口

为了修改端口映射,你需要删除旧的容器并重新创建一个新的容器。删除容器后,可以重新启动容器,并在创建时指定新的端口映射。假设原来的容器映射的是。如果你想重新配置端口,通常需要先停止当前运行的容器。这样你就成功修改了服务的端口映射并重新启动了容器。文件中修改端口映射,然后重新启动容器。文件来管理服务,可以直接在。,现在我们要将其修改为。

2024-09-06 17:11:12 500

原创 doris数据库核心知识梳理

Doris数据库内容笔记

2024-08-30 15:44:57 630

原创 创建Doris的外部MySQL catalog

Doris JDBC Catalog 支持通过标准 JDBC 接口连接 MySQL 数据库

2024-08-30 15:25:38 477

原创 电影人尼古拉斯凯奇的人物小传

尼古拉斯·凯奇(Nicolas Cage),原名尼古拉斯·金·科波拉(Nicolas Kim Coppola),1964年1月7日出生于美国加利福尼亚州长滩,是一位著名的美国演员和制片人。凯奇是好莱坞著名导演弗朗西斯·福特·科波拉(Francis Ford Coppola)的侄子,为了避免因家族关系而获得演艺事业的优待,他选择改姓“凯奇”。

2024-08-29 14:26:17 917

原创 Java的设计模式

在Java中,设计模式是一套被反复使用的、被多数人知晓的、经过分类编目的、代码设计经验的总结。它们是软件开发过程中为了提升代码的可维护性、可扩展性和可重用性而采用的解决方案。

2024-08-29 09:47:46 893

原创 设计模式之工厂模式和策略模式的区别

工厂模式关注于对象的创建,隐藏了具体产品类的实例化逻辑;策略模式关注于算法或行为的封装,通过接口允许不同算法互换使用。

2024-08-29 09:40:04 274

原创 apache Doris中的物化视图和rollup表

物化视图 在 Doris 中提供了更强大的查询优化能力,支持复杂的 SQL 查询语法,是优化复杂查询和数据分析的强大工具。Rollup 表则更适合简单的聚合查询优化,能够在较少的存储成本下提高查询性能。

2024-08-28 17:12:54 743

原创 apache Doris的逻辑视图和物化视图

逻辑视图 是一种轻量级的视图,它的优势在于不占用额外的存储空间,并能实时反映数据变化,但其性能可能较差。物化视图通过预计算和存储来大幅度提升查询性能,适用于需要快速响应的复杂查询场景,但它会占用额外的存储空间。

2024-08-28 17:09:33 334

原创 Apache Doris 使用 CBO 和 RBO 结合的优化策略

Apache Doris 的查询优化器结合了基于规则的优化器(Rule-Based Optimizer, RBO)和 基于代价的优化器(Cost-Based Optimizer, CBO),以实现高效的查询执行计划生成。这种策略充分利用了 RBO 的高效性和 CBO 的灵活性,为不同类型的查询提供了最佳的性能优化。

2024-08-27 17:04:53 380

原创 Apache Doris 采用了自适应查询执行(Adaptive Query Execution)技术

Apache Doris 通过自适应查询执行(AQE)和 Runtime Filter 技术,极大地增强了查询优化的灵活性和效率。AQE 能够根据实时的运行时信息动态调整查询计划,适应复杂多变的数据场景。而 Runtime Filter 则通过在查询执行过程中动态生成和应用过滤条件,显著减少了数据处理量和 I/O 开销,提升了查询性能。结合这两者,Apache Doris 能够在大规模数据分析中提供高效、灵活的查询处理能力,是一种非常强大的查询优化技术。

2024-08-27 16:55:14 159

原创 数据分析中的上钻、下钻、切片和切块

上钻”、“下钻”、“切片”、“切块”是数据分析和数据展示中的常见概念,尤其是在处理多维数据或数据仓库时。

2024-08-27 16:42:42 392

原创 电影中的声音表达

电影中的声音构成不仅仅是对画面的补充,更是叙事的核心组成部分之一。不同的声音元素协同工作,可以大大增强影片的情感深度、叙事效果和观众的沉浸体验。通过对白传达信息,音效增加真实感,环境音建立氛围,音乐引导情感,而静音与音频对比则通过其独特的表现方式,强化叙事和情感表达。优秀的电影创作者往往对声音设计给予极高的重视,因为声音不仅能丰富电影的叙事层次,还能在视觉无法传达的地方,用声音创造出一个更为立体和感人的电影世界。

2024-08-23 15:53:22 925

原创 电影中的构图

电影中的构图不仅仅是关于如何让画面看起来美观,更重要的是它通过视觉设计传递故事情节、情感和主题。不同类型的构图可以影响观众的情绪、引导视线、塑造角色关系、并加强影片的叙事效果。优秀的电影制作人在构图设计上往往极其用心,通过对每一个画面的精心安排,将电影从简单的视觉呈现提升为深刻的艺术表达。

2024-08-23 15:42:34 896

原创 电影中的过肩镜头表达

过肩镜头是电影中一种非常有效的视听语言工具,它不仅能够强化角色之间的情感交流,还能通过构图、视角和镜头切换来引导观众的注意力、表现权力关系、制造紧张感等。这种镜头语言在电影中应用广泛,能够巧妙地增强叙事的层次感和观众的情感体验。

2024-08-23 15:27:02 594

原创 电影如何运用镜头语言表达人物的情绪变化?

通过这些镜头语言,导演可以在观众心中种下特定的情绪和心理暗示,使得电影不仅仅是叙述故事,更成为一种感官与情感的综合体验。

2024-08-23 15:17:17 796

原创 电影中的拍摄手法

电影中的拍摄手法指的是导演和摄影师在拍摄过程中使用的各种技术和方法,以达到特定的视觉效果、叙事目的或情感表达

2024-08-21 16:48:13 774

原创 java集合中自动排序的treeset和treemap

`TreeSet` 和 `TreeMap` 都是基于红黑树的数据结构,能够提供自动排序的集合操作。`TreeSet` 适用于存储有序且不重复的元素集合,而 `TreeMap` 适用于存储有序的键值对。红黑树的平衡性确保了这些集合类在进行插入、删除和查找操作时的高效性。`TreeSet` 和 `TreeMap` 是 Java 集合框架中用于存储有序数据的集合类,它们都基于红黑树实现,并且提供了自动排序功能。

2024-08-21 14:53:57 421

原创 java中的Collections

Java 的集合框架 (Java Collections Framework) 是 Java 标准库中用于存储和操作数据的一个重要部分。它包括了多个接口和类来支持集合操作,如添加、删除、遍历和排序等。

2024-08-21 14:13:50 515

原创 Java代码中的private static final long serialVersionUID = -1L作用

`private static final long serialVersionUID = -1L;` 是 Java 类中的一个字段声明,通常用于实现 `Serializable` 接口的类中。

2024-08-20 11:17:16 58

原创 Apache Doris 的 Incremental Read增量读取,数据合并,数据清理

Incremental Read(增量读取)是 Apache Doris 用来提高查询效率的一个重要功能。它的核心思想是通过增量地读取和处理数据,减少不必要的数据扫描,从而加速查询的执行。这个功能特别适用于那些数据更新频繁但查询侧重于最新数据的场景。

2024-08-15 14:36:23 322

原创 apache huidi 时间旅行Time Travel)机制

Apache Hudi 的时间旅行功能主要依赖于提交日志、基础文件与增量日志的结合,以及通过合并与压缩来管理数据的多个版本。索引机制则进一步提高了查询的效率。通过这些机制,Hudi 能够实现高效的时间旅行查询,允许用户访问数据的历史版本。

2024-08-15 14:20:35 418

详细解读DreamFusion:利用2D扩散实现文本到3D的转换 论文文档

详细解读DreamFusion:利用2D扩散实现文本到3D的转换 论文文档

2024-04-26

apache seatunnel支持hive jdbc

apache seatunnel支持hive jdbc

2023-10-30

鲸鱼优化算法(Whale Optimization Algorithm,WOA)剖析

鲸鱼优化算法(Whale Optimization Algorithm,WOA)剖析

2023-10-25

ubuntod安装datasophon问题记录

chkconfig命令

2023-10-10

Clickhouse调研

Clickhouse调研

2023-08-03

读取Excel多个Sheet数据(Java code)

Java实现读取Excel多个Sheet数据 测试

2023-08-01

seatunnel 支持hive jdbc

source { Jdbc { url = "jdbc:hive2://111.11.11.11:10000/ods_wjw" driver = "org.apache.hive.jdbc.HiveDriver" user = "hive" password = "hive" table = ods_wjw_jb_gxy_hz_glk query = "select a,b,c from ods_wjw_jb_gxy_hz_glk" fetch_size = 300 } }

2023-07-28

gbase免费安装包,8.6.2

gbase免费安装包,8.6.2

2023-06-06

gbase免费安装包以及驱动

gbase免费安装包以及驱动

2023-06-06

dataCollection安装jar包0.07版本

dataCollection项目在kettle基础开发的可视化任务调度系统,提供简单易用的操作界面,降低用户使用crontab调度的学习成本,缩短任务配置时间,避免配置过程中出错。系统对接webSpoon,支持在线编辑kettle脚本,通过数据整合功能,可同步资源库中已有的脚本,用户在创建完脚本之后,可通过系统任务管理,创建数据同步任务。

2023-01-16

hbase-manager安装包,已编译

部署网站https://gitee.com/weixiaotome/hbase-manager#1-%E5%B9%B3%E5%8F%B0%E7%AE%80%E4%BB%8B HBaseManager功能列表 namespace管理:包括namespace的创建、删除 HBase表管理:表创建、预分区建表(内置三种预分区方案)、表删除、表信息更改、表清空 列簇管理:列簇新增、删除、属性修改 标签管理:HBase表的标签管理 数据管理:HBase表数据的查询、新增、删除。 多集群管理:多集群切换。 监控功能:后续可能会考虑增加丰富的监控功能,以期待代替HBase本身的监控界面 WebShell:基于Web的HBase Shell (规划中) HQL: 以SQL的方式读写HBase集群中的数据 请求热点监控:集成hbase-hbtop的功能,图表展示RegionServer/Region/namespace/table的实时请求量 更多功能:......

2022-11-14

hbase-sdk的jar包

hbase-manager项目编译所需

2022-11-14

hbase-sdk的jar包

hbase-manager编译需要 如果你的HBase版本是1.x,可以使用这个jar包

2022-11-14

Poseidon波塞冬日志搜索平台文档

可以看看

2022-10-10

flink-shaded-hadoop-2-uber-3.0.0-9.0.jar

Flink sink cdh6.2 hadoop3.0.0 jar包

2021-04-16

数独android

3G千锋android游戏数独可运行,按照视频并解决问题

2014-08-04

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除