自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (63)
  • 收藏
  • 关注

原创 Impala实时刷新同步Hive元数据

背景通过HIVE对数据进行操作或更新元数据,Impala是无感知的,官方提供了两种手动刷新的方式,分别是INVALIDATE METADATA和REFRESH操作。但是使用起来相当不方便,针对此问题,想到两种简单的应对方案。方案一如果ETL处理都是通过脚本执行,那么可以考虑在脚本中添加手动刷新的命令,即某个表的数据已通过脚本处理完成,脚本的最后调用impala刷新一下这个表。这种方式无法处理...

2018-11-30 08:12:53 11197 5

原创 Impala 代替 hive COLLECT_SET函数的方式

背景之前是在HIVE上开发,GROUP BY 某些字段后,其他字段使用COLLECT_SET(ITEM)[0]的方式取相同字段值中的一个,而在Impala上没有COLLECT_SET函数。方案使用GROUP_CONCAT函数+SPLIT_PART函数替代## IMPALASELECT SCORE,SPLIT_PART(GROUP_CONCAT(NAME),',',1) FROM TEST...

2018-11-15 09:25:00 6431

原创 Hadoop dr.who问题

背景昨天在生产环境偶然发现,yarn的一些日志访问不了,报如下错误 User [dr.who] is not authorized to view the logs for application;然后发现hdfs管理界面有些文件目录页进不去,登录即右上角为logged in as dr.who。然后到网上查找资料。原因Resource Manager UI的默认用户dr.who权限不正确...

2018-11-14 08:28:56 8473

原创 Impala权限控制

开头Impala因为是Cloudera出的,所以官方文档说明里只写了使用自家的Sentry方式进行权限管理,而对于Hortonworks家的Ranger只字未提,网上都是说可以通过特殊方案集成到Ranger上,但是没有找到具体方案,在此也提不了了。首先,Sentry 的使用有两种方式,一是基于文件的存储方式(SimpleFileProviderBackend),一是基于数据库的存储方式(Sim...

2018-11-08 21:08:16 4373

原创 Sentry与Ranger

Sentry:RBAC(role-based acess control)基于角色的管理,比如Cloudera用的是Sentry,华为的FusionInsight也采用类似的机制。即:通过创建角色,将每个组件的权限授予给此角色。然后在用户中添加此角色,即用户具备此角色访问组件的权限(组也类似)Ranger: PBAC(policy-based acess control)基于策略的管理,比如H...

2018-11-07 22:15:06 1496

原创 Sqoop同步hive的parquet数据问题

目前通过Sqoop从Hive的parquet抽数到关系型数据库的时候会报kitesdk找不到文件的错,这是Sqoop的BUG,通过使用hcatlog的方式解决。ERROR sqoop.Sqoop: Got exception running Sqoop: org.kitesdk.data.DatasetNotFoundException: Descriptor location does not...

2018-11-06 08:23:39 2994

用户故事地图 PDF

产品经理,精益敏捷,迭代运作,用户故事,描述需求与开发高效协同。此版本为PDF版本,清晰度还不错,分享给大家。。。

2020-10-06

网易时序大数据应用实践

网易时序大数据应用实践~

2018-12-11

人脸表情识别FER2013数据集

KAGGLE 人脸表情识别FER2013数据集

2018-10-10

Facial-Expression-Recognition模型文件

github上WuJie1010的Facial-Expression-Recognition模型文件

2018-10-06

颜色迁移程序

参考图像可以选择1幅,也可以选择多幅,不支持灰度图像彩色化,对某些互补色处理不好。

2017-06-07

TensorFlow白皮书(官方文档)

Google谷歌官方TensorFlow白皮书,官方使用说明文档~~

2015-12-01

Python2.x OpenCV模块包(64位)

Python2.x OpenCV模块包,64位,具体配置见lz博客

2015-06-13

Python2.x OpenCV模块包

Python2.x OpenCV模块包,32位。配置说明见lz博客

2015-06-13

计算机程序设计艺术_卷4_4_生成所有树组合生成和历史

计算机程序设计艺术_卷4_4_生成所有树组合生成和历史,中文扫描版,248页

2015-05-28

计算机程序设计艺术_卷4_2_生成所有元组和排列

计算机程序设计艺术_卷4_2_生成所有元组和排列,中文扫描版,272页

2015-05-28

计算机程序设计艺术_卷4_1_A

计算机程序设计艺术_卷4_1_A,英文版,123页

2015-05-28

计算机程序设计艺术_卷4_0_组合算法与布尔函数概论

计算机程序设计艺术_卷4_0_组合算法与布尔函数概论,中文扫描版,443页

2015-05-28

PHP从入门到精通

PHP从入门到精通第2版,中文扫描版,无书签,575页

2015-05-28

加密与解密 (第三版)

加密与解密 (第三版),中文扫描版,无书签,570页

2015-05-28

计算机网络第五版

计算机网络第五版,中文扫描版,有书签,420页

2015-05-28

黑客反汇编揭秘

黑客反汇编揭秘,中文扫描版,无书签,547页

2015-05-28

建筑的永恒之道

建筑的永恒之道,非扫描版,无书签,310页

2015-05-28

Git教程中文版

Git教程,廖雪峰,非扫描版,无书签,77页

2015-05-28

推荐系统实践

推荐系统实践,非扫描版,无书签,215页

2015-05-28

数据挖掘导论

数据挖掘导论,中文扫描版,有书签,479页

2015-05-28

数据挖掘:概念与技术(中文第三版

数据挖掘:概念与技术(中文第三版),中文扫描版,495页

2015-05-28

大数据(涂子沛)

大数据(涂子沛),非扫描版,无书签,341页

2015-05-28

黑客:计算机革命的英雄

黑客:计算机革命的英雄,中文扫描版,352页

2015-05-28

算法导论(英)-第三版

算法导论,第三版,英文版,非扫描版,有书签,1313页

2015-05-28

简明Python教程

简明Python教程,非扫描版,有书签,212页

2015-05-28

机器学习实战python版

机器学习实战python版,中文扫描版,无书签,296页

2015-05-28

Python学习笔记

Python学习笔记,皮大庆,非扫描版,无书签,98页

2015-05-28

Programming Computer Vision with Python

Programming Computer Vision with Python,英文版,无书签,300页

2015-05-28

数据结构与算法分析C++语言描述

数据结构与算法分析C++语言描述,中文扫描版,有书签,454页

2015-05-28

More_Effective_C++中文版

More_Effective_C++中文版,非扫描版,无书签,264页

2015-05-28

Exceptional_C++中文版

Exceptional_C++中文版,非扫描版,无书签,80页

2015-05-28

Essential_C++中文版

Essential_C++,中文扫描版,有书签,303页

2015-05-28

Effective_STL(中文版)

Effective_STL(中文版),非扫描版,无书签,245页

2015-05-28

C++ 语言的设计和演化

C++语言的设计和演化,中文扫描版,无书签,386页

2015-05-28

C++ 设计新思维

C++设计新思维,中文扫描版,无书签,348页

2015-05-28

颜色迁移算法

本代码包含Reinhard算法,KMean均值聚类,FCM模糊聚类等颜色迁移算法,因为年久失修,代码并不完善,但是基本的运行效果是有的。可以给初学者以参考~关于资源分,因为关键代码在lz的博文中都已给出,想看算法的代码直接去文章里看,对于那些伸手就要的童鞋们,要付出一点分的哦~

2015-05-26

SHA-1算法实现源代码

C++写的SHA-1算法实现源代码,供借鉴学习使用~~~

2014-09-29

MD5算法实现源代码

MD5算法,使用C\C++实现,可以进行借鉴学习~~~~

2014-09-26

对话框控件大小位置改变

利用宏控制对话框上的控件,随对话框大小的改变而改变大小与位置~方便使用

2014-08-22

GDI多线程绘图

gdi绘图的多线程实现,是MFC框架下的,MS标准例子

2014-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除