自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

tom_fans的博客

大数据架构运维开发

  • 博客(3)
  • 收藏
  • 关注

原创 ERROR: No server address listed in hbase:meta for region test1,,1517390330801.40ff7bbead5f57620c4ef2

ERROR: No server address listed in hbase:meta for region test1,,1517390330801.40ff7bbead5f57620c4ef2126403a109. containing row上面是HBASE查询表的一个错误。业务逻辑很简单,每天通过SQOOP抽取数据到HBASE,建立HIVE关联表,通过SPARK SQL关联查询,然

2018-01-31 18:01:59 7128 3

原创 HBASE同步数据到SOLR

HBase Indexer, 又名key value store indexer, 解析HBASE的日志,生成SOLR语法并插入,简单理解就是HBASE的数据同步到SOLR。为什么会有这个东西的存在? HBASE不支持事务,也就意味着不支持二级索引,但是在实际的工作当中会发现二级索引的使用非常重要,查询如果光从rowkey来考虑设计,很难,或者说做不到,因此二级索引的组件就产生了。有一个项目,我们

2018-01-19 10:52:45 3556

原创 Spark处理时间序列数据

整个逻辑为: 设备端毫秒级生成数据以文本方式传输到HDFS,然后通过SPARK解析文件并存储到HBASE中。问题1:SPARK本身为分布式,如果通过分布式解析文件并存储,如何保证数据系列顺序?问题2:使用SPARK进行HBASE插入的时候,使用RddPartitionForeach,然后给每条记录生成时间戳,并插入到HBASE,发现即使是微妙级别,在foreach的时候仍然会出现时间相同的

2018-01-15 17:45:51 5069

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除