自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

bigdata_player

大数据工厂

  • 博客(10)
  • 资源 (8)
  • 收藏
  • 关注

转载 HBase原理|HBase内存管理之MemStore进化论

Java工程中内存管理总是一个绕不过去的知识模块,无论HBase、Flink还是Spark等,如果使用的JVM堆比较大同时对读写延迟等性能有较高要求,一般都会选择自己管理内存,而且一般都会选择使用部分堆外内存。HBase系统中有两块大的内存管理模块,一块是MemStore ,一块是BlockCache,这两块内存的管理在HBase的版本迭代过程中不断进行过各种优化,接下来笔者结合自己...

2019-10-23 14:47:04 834

转载 如何在 1 秒内做到大数据精准去重?

去重计数在企业日常分析中应用广泛,如用户留存、销售统计、广告营销等。海量数据下的去重计数十分消耗资源,动辄几分钟,甚至几小时,Apache Kylin 如何做到秒级的低延迟精确去重呢?

2019-10-18 11:47:36 807

转载 Kylin 精确去重在用户行为分析中的妙用

示例 先从一个简单的例子说起吧。现在有一个 app 的用户访问记录表 access_log,它包含三个字段:DT (访问日期),User ID(用户标示)和 Page(访问页): DT User ID Page 20190101 100 index.html ...

2019-10-18 11:44:56 854

原创 基于HDFS搭建单机Alluxio

一、下载wget https://downloads.alluxio.io/downloads/files/2.0.1/alluxio-2.0.1-bin.tar.gz二、配置1)对本机用户免密码登录2)修改alluxio-site.prepertiesalluxio.master.hostname=localhostalluxio.master.mount.tab...

2019-10-17 14:51:50 276

原创 Keepalived + Mysql双主模式 搭建高可用集群

一、mysql安装 https://blog.csdn.net/qq_23160237/article/details/102467487二、mysql配置双主模式1)修改/etc/my.cnf# 增加以下参数# server-id 主备机子不能相同# auto-increment-offset 自增长主键起始点不能相同,防止主键冲突# 主serve...

2019-10-17 11:55:50 350

原创 KYLIN使用spark构建引擎(HDP2.6.5.0环境)

一、搭建环境kylin版本: 2.6.4 hdp版本:2.6.5.0 spark版本:2.3.2二、配置1)配置HADOOP_CONF_DIRexport HADOOP_CONF_DIR=/usr/hdp/2.6.5.0-292/hadoop/conf2)配置SPARK_HOME# sparkexport SPARK_HOME=/usr/hdp/2.6.5.0...

2019-10-14 17:47:28 1082

原创 mysql8.X安装

一、官网 https://dev.mysql.com/downloads/mysql/8.0.html#downloads二、安装下载wget https://dev.mysql.com/get/Downloads/MySQL-8.0/mysql-8.0.17-1.el7.x86_64.rpm-bundle.tar解压并安装# 解...

2019-10-10 14:03:21 152

原创 mysql5.7安装

一、官网 https://dev.mysql.com/downloads/mysql/5.7.html#downloads二、安装下载wgethttps://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.27-1.el7.x86_64.rpm-bundle.tar解压并安装tar...

2019-10-09 18:55:57 359

原创 KYLIN元数据迁移(测试环境配置迁移至生产环境)

一般项目开发都会有测试环境和生产环境,在上线之际,如果要将测试环境的cube信息导入生产环境,该怎么办呢?通过curl请求?太low了吧,其实,官网提供了元数据迁移方案,让我们一起看看吧!

2019-10-09 11:54:52 751

原创 如何正确访问 redis 中的海量数据?避免事故产生(keys * VS scan)

事故产生 因为我们的用户token缓存是采用了【user_token:userid】格式的key,保存用户的token的值。我们运维为了帮助开发小伙伴们查一下线上现在有多少登录用户。 直接用了keys user_token*方式进行查询,事故就此发生了。导致redis不可用,假死。分析原因 我们线上的登录用户有几百万,数据量比较多;keys算...

2019-10-07 17:21:02 387

zookeeper备份恢复工具

可以指定zk node进行备份与恢复,方便使用

2021-11-05

kafka-manager2.0.0.2

kafka-manager编译后的安装包,直接解压安装,免编译!

2020-12-16

kafka-manager3.0.0.4安装包(编译后)

kafka-manager编译后的安装包,直接解压安装,免编译!

2020-12-16

推荐系统算法工程师——从入门到就业.txt

推荐系统是电商和内容型app网站生存的重要手段,是以重新组织物品分类和聚类方式形成的人工智能系统。亚马逊的商品推荐、优酷的视频推荐,都是推荐系统的应用实例。每一个具体的应用场景中推荐系统表现形式有所不同,但是最终都是以增加内容、商品曝光度为前提的。 推荐系统根据每一个用户的行为和喜好,找到这个用户未来可能喜欢和购买的商品或者是物品。它使得内容、电商两大产业减少了大量的人工编辑推荐的工作,只需要用一些简单或者深入的算法,就可以达到很好的效果。

2019-11-26

clickhouse之zabbix监控模板(支持账号密码,配置文件可传)

clickhouse之zabbix监控模板(支持账号密码,配置文件可传)

2019-09-24

flink on yarn 缺少依赖NoClassDefFoundError: com/sun/jersey

flink-hadoop-compatibility_2.12-1.7.1.jar javax.ws.rs-api-2.0.1.jar jersey-common-2.27.jar jersey-core-1.19.4.jar 解决 Exception in thread "main" java.lang.NoClassDefFoundError: com/sun/jersey/api/client/config/ClientConfig

2019-06-06

apache-kylin-2.6.2-bin-hadoop3.tar.gz

apache-kylin-2.6.2-bin-hadoop3.tar.gz 最新版本修复版下载, 修改 报错 Missing required configuration "partition.assignment.strategy" which has no default value. ".

2019-05-15

Spring 加密工具包(kylin密码加密工具包)

使用方法:用java命令 java -jar encryption.jar admin

2019-04-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除