大大大大大大太阳
码龄7年
关注
提问 私信
  • 博客:70,262
    70,262
    总访问量
  • 23
    原创
  • 1,743,424
    排名
  • 11
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2017-09-21
博客简介:

wu的博客

博客描述:
如果你有两个选择,就选较难的那个。
查看详细资料
个人成就
  • 获得31次点赞
  • 内容获得16次评论
  • 获得103次收藏
  • 代码片获得123次分享
创作历程
  • 1篇
    2022年
  • 4篇
    2021年
  • 5篇
    2020年
  • 6篇
    2019年
  • 9篇
    2018年
成就勋章
TA的专栏
  • Flink
    1篇
  • ClickHouse
    8篇
  • CDH集群安装
    3篇
  • Kerberos
    4篇
  • Impala
    1篇
  • Hive
    5篇
  • Hbase
    1篇
  • Linux
    1篇
  • spark
    3篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Flink yarn 任务job失败 yran application_xxx_id 还处于running状态

Flink yarn 任务job失败 yran application_xxx_id 还处于running状态
原创
发布博客 2022.11.10 ·
1071 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

ClickHouse官方窗口函数示例

ClickHouse官方窗口函数示例官网:https://github.com/ClickHouse/ClickHouse/blob/master/tests/queries/0_stateless/01591_window_functions.sql-- { echo }set allow_experimental_window_functions = 1;-- just something basicselect number, count() over (partition by int
原创
发布博客 2021.04.08 ·
2099 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

ClickHouse row_number()、开窗函数(rank()等)

正宗的ClickHouse开窗函数来袭在今年2月6号线上举行的 ClickHouse China Spring Meetup 中,朵夫为我们带来了 ClickHouse Features 2021 的分享,其中有非常多强大的新特性,幻灯片的下载地址如下:https://presentations.clickhouse.tech/meetup50/new_features/在众多的新特性中,我对开窗函数、自定义UDF、ZooKeeper优化等几项特别感兴趣,后续我也打算分别用几篇文章来展开说明。现在
转载
发布博客 2021.03.31 ·
9630 阅读 ·
2 点赞 ·
0 评论 ·
11 收藏

Clickhouse 单节点多实例部署

Clickhouse版本:21.3.4.25背景机器分配不足单机多实例配置复制配置文件信息复制配置文件给新实例使用sudo cp /etc/clickhouse-server/config.xml /etc/clickhouse-server/config9001.xmlsudo cp /etc/clickhouse-server/user.xml /etc/clickhouse-server/user9001.xmlsudo cp /etc/systemd/system/clickhou
原创
发布博客 2021.03.31 ·
1461 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

ClickHouse RPM不停机升级/降级

背景Clickhouse 20.3.18.10 升级到 21.3.4.25版本目的:该三月份发布的版本支持了更多通用的开窗函数,后续会介绍升级流程数据备份对于没有使用每个shard多副本的集群,并且数据表并非全部都是copy表的情况,我们在做升级的时候就需要考虑自己去做备份了,需要备份的数据有这么几种:1、配置(建议所有集群情况均备份,因为数据量很小):升级之前建议备份clickhouse相关的一些配置文件,默认是在/etc/clickhouse目录下的所有文件(不同环境若有不同请自行确认,总之
原创
发布博客 2021.03.31 ·
1377 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

hive对有null值的列进行avg,sum,count等聚合性操作结果测试

hive对有null值的列进行avg,sum,count等聚合性操作结果测试下面展示一些 内联代码片。数值、null、字符串等联合测试with tmp as(select NULL as col1 union allselect 'NULL' as col1 union allselect null as col1 union allselect 3 as col1 union allselect 2 as col1 union allselect '2' as col1)
原创
发布博客 2020.11.10 ·
998 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

ClickHouse删除数据之后再插入数据成功无报错但是查询不到数据

背景:在测试Clikchouse删除效率的时候插入同一大小同一顺序一样的数据发现查询该表数据缺失,刚刚插入的数据成功了,但是表里面没有:复现:建表:CREATE TABLE ck_test.t_local_1( `id` Int32, `day` Int32)ENGINE = ReplicatedMergeTree('/clickhouse/ck_test/t_local_1/{layer}-{shard}/', '{replica}')PARTITION BY dayO
原创
发布博客 2020.10.30 ·
4972 阅读 ·
1 点赞 ·
2 评论 ·
6 收藏

ClickHouse-rpm安装

介绍官方存在几种安装方式:https://clickhouse.tech/docs/en/getting-started/install/From RPM PackagesFrom Tgz ArchivesFrom Docker ImageFrom Precompiled Binaries for Non-Standard Environments本次主要这几种情况下的安装yum安装sudo yum install clickhouse-server clickhouse-client
原创
发布博客 2020.10.14 ·
3811 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

ClickHouse(system.query_log表)-开启慢sql查询

ClickHouse(system.query_log表)开启慢sql查询开启慢sql查询日志方法:打开各个ClickHouse实例的users.xml文件,在默认配置最上层profile(如default)中加入:<log_queries>1</log_queries>注意:如添加该参数之后表不自动创建,重启clickhouse-server服务即可检查每个节点ch中config.xml文件里默认的日志配置是否开启<query_log> &
原创
发布博客 2020.10.09 ·
9616 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

ClickHouse简介

简介ClickHouse是"战斗民族"俄罗斯搜索巨头Yandex公司开源的一个极具"战斗力"的实时数据分析数据库,是面向 OLAP 的分布式列式DBMS,圈内人戏称为"喀秋莎数据库"。ClickHouse简称"CH",但在中文社区里大家更偏爱"CK",反馈是因为有"AK"的感觉!与Hadoop、Spark这些巨无霸组件相比,ClickHouse很轻量级,且不依赖于其他组件。特点 列式存储数据库,数据压缩 快 关系型、支持SQL 分布式并行计算,可把单机性能压榨到极限 高可用 数据
原创
发布博客 2020.09.10 ·
2072 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Xshell6_ww.zip

发布资源 2019.05.27 ·
zip

CDH6.x 禁用/关闭Kerberos认证、常见问题排查记录

CDH 禁用 Kerberos直接在CDHmanger页面更改,重启即可HDFShadoop.security.authentication -&gt; simplehadoop.security.authorization -&gt; 取消勾选dfs.datanode.address -&gt; 改成50010dfs.datanode.http.address -&gt; 改成50...
原创
发布博客 2019.03.11 ·
2294 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

如何在Hive & Impala中使用UDF

如何在Hive &amp; Impala中使用UDF1、介绍如何在Hive、Impala中使用UDF函数1.如何使用Java开发Hive的自定义函数(如果使用spark sql注册UDF函数,请参考之前的博客Hive Spark Api 查询、写入、注册UDF函数,SparkSql简单操作)2.如何在Hive中创建自定义函数及使用3.如何在Impala中使用Hive的自定义函数2.UDF...
原创
发布博客 2019.03.11 ·
1503 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Impala JDBC41 连接jar

发布资源 2019.03.08 ·
jar

Spark OOM 问题详解及解决优化方法

Spark OOM 问题详解及解决优化方法转自: http://blog.csdn.net/yhb315279058/article/details/51035631Spark中的OOM问题不外乎以下两种情况map执行中内存溢出shuffle后内存溢出map执行中内存溢出代表了所有map类型的操作。包括:flatMap,filter,mapPatitions等。shuffle后内存...
转载
发布博客 2019.03.07 ·
577 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

如何高效的使用ForeachRDD

如何高效的使用ForeachRDD对于foreachRDD的正确理解,请参考对DStream.foreachRDD的理解在spark streaming的官方文档中也有对foreachRDD的说明,请参见Design Patterns for using foreachRDD基于数据的连接在实际的应用中经常会使用foreachRDD将数据存储到外部数据源,那么就会涉及到创建和外部数据源的连...
原创
发布博客 2019.03.07 ·
1146 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

DStream.foreachRDD的简单理解

如何高效的使用ForeachRDDforeachRDD(func)的官方解释为The most generic output operator that applies a function, func, to each RDD generated from the stream. This function should push the data in each RDD to an ex...
原创
发布博客 2019.03.07 ·
1137 阅读 ·
3 点赞 ·
0 评论 ·
2 收藏

Hive MR小文件优化、性能调优、大小数据量级执行优化

不仅如此Hive的SQL还可以通过用户定义的函数(UDF),用户定义的聚合(UDAF)和用户定义的表函数(UDTF)进行扩展。(几个函数之间的区别)Hive中不仅可以使用逗号和制表符分隔值(CSV / TSV)文本文件,还可以使用Sequence File、RC、ORC、Parquet (知道这几种存储格式的区别),当然Hive还可以通过用户来自定义自己的存储格式,基本上前面说的到的几种格式完全够了。Hive旨在最大限度地提高可伸缩性(通过向Hadoop集群动态添加更多机器扩展),性能,
原创
发布博客 2019.02.27 ·
2000 阅读 ·
2 点赞 ·
1 评论 ·
11 收藏

Linux 服务器代理 上网

Linux 服务 一键安装服务代理上网yum install squid -y安装完成之后,配置配置文件,可以使用下面的配置文件/etc/squid/squid.conf更改http_port 0.0.0.0:3128为代理端口## Recommended minimum configuration:## Example rule allowing access from...
原创
发布博客 2018.12.18 ·
5667 阅读 ·
2 点赞 ·
0 评论 ·
17 收藏

Kerberos 认证的Hbase Scala Api

Kerberos 认证的Hbase Scala Api配置文件#Hbase 连接参数kerberos.hbase.user21 = hbase/cdh21@HADOOP.COMkerberos.hbase.keytab21 = C:/Users/user/Desktop/keytable/hbase.keytabscala rowkey查询api(Hbase 2.0.0 版本)im...
原创
发布博客 2018.12.17 ·
960 阅读 ·
1 点赞 ·
2 评论 ·
0 收藏
加载更多