自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 hadoop hdfs HA 场景下JAVA API Client访问 HDFS

同事在用hdfs api 写入hdfs文件,2年前没有成功,这次一起解决了这个问题。详细代码如下: 客户端需要指定ns名称,节点配置,ConfiguredFailoverProxyProvider等信息。 代码示例: package cn.itacst.hadoop.hdfs; im...

2019-08-26 15:09:45 119 0

原创 Datanucleus 应用

在排查hivemetastore 时,对它详细了解,看到用到Datanucleus,对它也进行了解,详细了解这个方面应用,看到下面官网资料比较详细。希望测底研究的朋友,进行详细了解。 JDO : Caching Caching is an essential mechanism in prov...

2019-08-23 14:35:14 534 0

转载 HiveMetaStore模块代码分析及多个节点压力测试

从package结构来看,主要的5个package,让我们来看看这几个package的内容 (1)m有点etastore:是metastore模块的入口,也是整个metastore模块的核心所在,里面包含了HiveMetaStore类作为整个模块的核心,接收来自hive的请求,返回需要的信息。从p...

2019-08-20 16:01:27 280 0

原创 Hive metastore整体代码分析及详解

配置:我们的hive server2 目前配置有2个节点,每个节点上都有metastore和hiveeserver2 服务。这就几天在排查hivemetastore 告警问题,由于hivemetastore 采用的是thrift 结构,对thrift 进行了了解,而本告警日志中timed out ...

2019-08-19 16:11:26 852 0

转载 Hive架构和工作原理

一、Hive 架构 下面是Hive的架构图。 Hive的体系结构可以分为以下几部分: 1、用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是CLI,Cli启动的时候,会同时启动一个Hive副本。Client是Hive的客户端,用户连接至Hive Server。在启动...

2019-08-16 11:38:26 336 0

原创 训练集样本不平衡问题对深度学习的影响

自己在进行人脸识别测试过程,开始利用自己的照片进行训练,由于开始准确率低,就开始增加自己照片的数量,开始是准确率提升,而后就开始降低,以前了解过这个方面知识,因此在网上找一些相关资料进行验证,后来发现有人进行过详细的测试,于是自己进行一些梳理。 实验数据与使用的网络 所谓样本不平衡,就是指在分...

2019-08-11 19:37:16 630 0

转载 AI实战】手把手教你文字识别(检测篇二:AdvancedEAST、PixelLink方法)

感觉作者非常不错,把自己的东西奉献出来,大家可以自学,另外自学困难可以找原创作者 自然场景下的文字检测是深度学习的重要应用,在之前的文章中已经介绍过了在简单场景、复杂场景下的文字检测方法,包括MSER+NMS、CTPN、SegLink、EAST等方法,详见文章: 【AI实战】手把手教你...

2019-08-11 09:33:17 860 0

转载 【AI实战】手把手教你深度学习文字识别(文字检测篇:基于MSER, CTPN, SegLink, EAST等方法)...

文字检测是文字识别过程中的一个非常重要的环节,文字检测的主要目标是将图片中的文字区域位置检测出来,以便于进行后面的文字识别,只有找到了文本所在区域,才能对其内容进行识别。 文字检测的场景主要分为两种,一种是简单场景,另一种是复杂场景。其中,简单场景的文字检测较为简单,例如像书本扫描、屏幕截图、或...

2019-08-11 09:19:05 583 0

转载 如何降低 Python 的内存消耗量?

原文链接:https://data.newrank.cn/m/s.html?s=PigpOzA/LTE%3D 在程序执行期间,如果内存中存在大量处于活动状态的对象,就有可能出现内存问题,尤其是在可用内存总量有限的情况下。在本文中,我们将讨论通过缩小对象大幅减少Python所需内存量的方法。 ...

2019-08-09 12:33:05 279 0

原创 mysql中blob,text字段的合成索引

在处理mysql 性能时,遇到了longtext 类型性能问题,在网上找了一些解决方案,感觉这个不错。整理文档供以后参考 在mysql中,原来有一个叫合成索引的,可以提高blob,text字段的效率性能, 方法一: 但只能用在精确查询,核心是增加一个列,然后可以用md5进行散列,用散列值查找则...

2019-08-09 11:03:28 640 0

原创 python模块和包

模块和包 一 模块 1 什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀。 但其实import加载的模块分为四个通用类别:   1 使用python编写的代码(.py文件)   2 已被编译为共享库或DLL的C或C++...

2019-08-08 12:27:07 72 0

原创 Python3 模块路径问题彻解

让你的模块可用 将模块放置在正确的位置,可用下面的函数查看“正确的位置” >>> pprint.pprint(sys.path) ['', '/home/xx/$PYTHONPATH', '/usr/lib/python3...

2019-08-06 20:47:01 565 0

提示
确定要删除当前文章?
取消 删除