炼数成器
码龄10年
关注
提问 私信
  • 博客:180,357
    社区:40
    180,397
    总访问量
  • 62
    原创
  • 175,768
    排名
  • 561
    粉丝

个人简介:bystudying com

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:山东省
  • 加入CSDN时间: 2014-08-22
博客简介:

炼数成器

博客描述:
炼数成器
查看详细资料
  • 原力等级
    当前等级
    4
    当前总分
    663
    当月
    6
个人成就
  • 获得91次点赞
  • 内容获得26次评论
  • 获得225次收藏
  • 代码片获得1,373次分享
创作历程
  • 1篇
    2024年
  • 11篇
    2023年
  • 5篇
    2022年
  • 24篇
    2021年
  • 18篇
    2020年
  • 4篇
    2019年
成就勋章
TA的专栏
  • Kafka
    2篇
  • 运维
    1篇
  • Java
  • Hive
    13篇
  • Hadoop
    6篇
  • Doris
    1篇
  • Spark
    5篇
  • 任务调度
    1篇
  • Druid
    3篇
  • Linux
    2篇
  • Scala
  • 笔记
  • Clickhouse
    1篇
  • Flink
    3篇
  • Storage
  • Sqoop
    1篇
  • Python
    1篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Docker命令大全

从容器中复制文件/文件夹到本地文件系统,或从本地文件系统复制到容器。从 Dockerfile 构建一个新的镜像。导出容器的文件系统为一个 tar 包。搜索 Docker Hub 中的镜像。查看 Docker 对象的详细信息。显示 Docker 系统的详细信息。恢复一个被暂停的容器中的所有进程。从 Docker 仓库下载镜像。将一个镜像保存为 tar 包。从 tar 包中加载一个镜像。启动一个或多个已停止的容器。创建一个新的容器但不启动它。显示容器的资源使用统计信息。暂停一个容器中的所有进程。
原创
发布博客 2024.05.29 ·
1318 阅读 ·
14 点赞 ·
1 评论 ·
6 收藏

OrientDB使用教程:全面了解图数据库

OrientDB 是一种多模型数据库系统,支持图形(Graph)、文档(Document)、键值(Key-Value)和对象(Object)数据模型。它是一个开源的、高性能的、可扩展的、支持 ACID 事务的 NoSQL 数据库。OrientDB 在一个单一的引擎中融合了关系型数据库和图数据库的特性,使得它适用于各种不同类型的应用场景。
原创
发布博客 2023.12.29 ·
2766 阅读 ·
21 点赞 ·
0 评论 ·
33 收藏

kerberos GSS initiate failed认证失败的原因及解决方案

这就导致同一任务可能会并发执行kinit操作,而 kerberos Ticket Cache文件存储在/tmp目录下,文件名为krb5cc_{uid},其中uid为用户标识号。因为同一OS用户下的多个脚本共享相同的uid,由于并发kinit操作,不同的认证可能会覆盖同一个uid下的Ticket Cache文件,导致Kerberos认证信息串掉。环境变量为每个Kerberos用户指定独立的Ticket Cache文件,解决并发执行脚本时Ticket Cache文件被覆盖的问题。通过在Shell脚本中设置。
原创
发布博客 2023.12.29 ·
3835 阅读 ·
8 点赞 ·
0 评论 ·
12 收藏

sqlplus set参数大区

打开SERVEROUTPUT功能,并执行一个包含PL/SQL块的代码。在执行时,将显示PL/SQL块中的输出信息。设置每行的最大字符数为100,每页的行数为20,并执行一个查询语句。查询结果将根据设置的行数进行分页显示。打开VERIFY功能,并执行一个带有替换变量的查询语句。在执行时,将显示替换变量的实际值,方便调试和验证。打开AUTOTRACE功能,并执行一个查询语句。在输出结果中,将显示SQL语句的执行计划和统计信息。[info]本文发自csdn,未经许可禁止复制转载到其他网站。
原创
发布博客 2023.11.10 ·
892 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

记一次fineBI的增量删除更新BUG

修改表的字段配置后,一定要注意表是否配置了增量删除更新,否则需要修改增量逻辑;如果只是增量更新没有删除,或者全量更新,不用修改设置。官方文档链接是https://help.fanruan.com/finebi/doc-view-1663.html。增量删除:这里也不能像官网描述那样使用select * ,必须指定字段集合。增量删除:按照表配置的字段集合来手动指明字段,而不是官网的描述那样;按照官方文档,增量删除不能使用select * ,且需要指定分区建。
原创
发布博客 2023.10.11 ·
3760 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

StarRocks将其弹性许可证2.0重新授权给Apache许可证2.0

在Apache许可证2.0下,您可以在更多的场景中自由使用和开发StarRocks,包括基于StarRocks构建分析数据库托管服务。自从StarRocks在GitHub上发布我们的代码以来,仅仅一年多一点的时间,社区就有了巨大的增长。我们期待着StarRocks社区的不断发展,并希望您能加入我们,共同构建世界上最先进的分析数据库!为了更好地支持StarRocks项目的发展,发展社区,以便我们可以在不同的用例中解决更多的问题,我们决定切换许可证。
翻译
发布博客 2023.09.27 ·
477 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hutool 在scala 和java 的时间区别

DateUtil.offsetHour(DateUtil.beginOfDay(DateUtil.date()), -31) idea正确 但服务器错误。最近在使用spark翻译mybatis的java代码的过程中,将java代码直接翻译到scala中,但是在对数的过程中,发现设计日期比较的都存在误差,scala版中加上 toInstant.atZone(ZoneId.systemDefault()).toLocalDateTime)这个问题仅仅出现在获取时间戳的时候,获取其他格式的日期是正常的。
原创
发布博客 2023.09.26 ·
156 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Linux环境下python连接Oracle教程

cx_Oracle是一个用于Python的第三方库,提供了与Oracle数据库进行交互的功能。可以在python中用cx_Oracle来连接Oracle数据库。或者 /etc/profile 等等。下面是一个批量执行上面安装命令的shell脚本。选择Oracle版本。下载3个rpm安装包。
原创
发布博客 2023.08.19 ·
2473 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

spark导入doris的几种方式

本文主要介绍通过spark导入doris的3种方式。
原创
发布博客 2023.08.11 ·
2647 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

集群部署dolphinscheduler踩坑

本文主要总结一下最新版dolphinscheduler3.1.5的安装过程中遇到的坑。
原创
发布博客 2023.07.31 ·
2682 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

doris导入报错问题集合

解决:只能在doris里设置全局或会话,目前无法支持在jdbc上设置,官方明确表示在1.2.5版本中将会支持connection timeout。2.0版本或许会支持query设置。由于enable_insert_strict的默认值是false,当前执行 INSERT 语句时,有不符合目标表格式的数据,比如字符串超过字段类型等等,导入任务会直接报错。只要有一条数据被正确导入,则返回成功。数据默认是单条写入,需要改成批量。
原创
发布博客 2023.07.07 ·
4911 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

Linux系统安装常见工具

"Development Tools"将安装一系列的软件包,包括gcc编译器、make构建工具、调试器、自动化工具等。这些工具对于编译和构建软件项目非常有用。“Nmap”(Network Mapper)是一个开源的网络扫描和安全评估工具。它用于探测和分析网络主机、端口状态和服务信息。sysstat"是一个系统性能监控工具集合,它提供了一组用于监视和分析系统资源使用情况的实用程序。“nano”,它是一个基本的文本编辑器,类似于其他常见的文本编辑器(如vim、emacs等)
原创
发布博客 2023.05.20 ·
2865 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

Hive矢量化

Hive 矢量化
原创
发布博客 2022.10.19 ·
2844 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

Hive Unknown rows affected

Hive Unknown rows affected
原创
发布博客 2022.09.05 ·
1987 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive开启CTE物化

CTE(Common Table Expression)公共表表达式简称 CTE,处理方式类似于视图扩展,是Hive三种保存临时结果的方法之一(另外两种是临时表和物化视图), Hive早在 0.13.0 的时候便加入了这个功能。
原创
发布博客 2022.09.05 ·
3295 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Hive 3种map join

3种map join
原创
发布博客 2022.09.02 ·
2275 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

hive 写入分区oom

1.内存优化列式存储的文件在写入文件之前都会将一定数量的数据缓存在内存中,由于hive每个动态分区目录都会打开一个文件写入器(file writer),所以当存在很多分区的时候,有可能会导致mapper OOM,所以需要增加内存。或者限制每次任务的分区数。另外缓冲区(file buffer)的大小最好跟block一样大,set Parquetbuffer size=blocksize2.开启hive.optimize.sort.dynamic.partition通过explain 发现 动态分区跟sq
原创
发布博客 2022.03.14 ·
4562 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

通过YARN Label实现大数据集群资源管理与隔离

1.Hive有哪些参数,如何查看这些参数 Hive自带的配置属性列表封装在HiveConfJava类中,因此请参阅该HiveConf.java文件以获取Hive版本中可用的配置属性的完整列表。具体可以下载hive.src通过eclipse查看。全部属性有上千个吧,一般Hive的自带属性都是以hive.开头的,每个属性且自带详细的描述信息,其次Hive官网也有,但是属性不是特别全。Hive官方参数网址Hive除了自身带了一些配置属性,因为其底层使用的是h...
原创
发布博客 2021.12.31 ·
181 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

HIVE 配置大全参考

HIVE 配置文件详解hive的配置:hive.aux.jars.path:当用户自定义了UDF或者SerDe,这些插件的jar都要放到这个目录下,无默认值hive.partition.pruning:在编译器发现一个query语句中使用分区表然而未提供任何分区谓词做查询时,抛出一个错误从而保护分区表,默认是nonstrict(待读源码后细化,网上资料极少)- hive.map.aggr:map端聚合是否开启,默认开启hive.join.emit.interval:在发出join结果之前对join
原创
发布博客 2021.12.15 ·
1963 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive数据倾斜

hive join 数据倾斜 解决办法
原创
发布博客 2021.11.24 ·
2416 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏
加载更多