自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

周源的专栏

大数据Hadoop生态圈最新前沿技术研究 包括架构设计、解决方案、应用开发、安全领域、集群规划部署等

  • 博客(3)
  • 资源 (2)
  • 收藏
  • 关注

原创 Kafka更新offset,scala反射调用进行测试

实现的类为KafkaCluster,实现必须放在包名为org.apache.spark.streaming.kafka目录下,不然集群上会报错(当时打算采用反射来实现),打印参数发现不对,记录下

2017-06-01 20:50:12 1108

原创 从HBase数据库表中读取数据动态转为DataFrame格式,方便后续用Spark SQL操作(scala实现)

个人研究后,才发现HBase存储的都是字符串类型,大部分函数都是byte[]字节类型来操作,需要用到HBaseTableCatalog类,需要导入hbase-spark-***.jar相关jar包,下载链接:http://maven.wso2.org/nexus/content/repositories/Apache/org/apache/hbase/hbase-spark/2.0.0-SNAPS

2017-06-01 20:39:52 3966 1

原创 Spark统计唯一值、缺失值和单值的算子(scala实现)

采用传统的Spark SQL编写sql语句循环多次按列查询来实现效率太低,如是采用基本的WordCount统计单词的思想,“columnName+value”即“列名:值”作为唯一单词,用特殊分隔符隔开,遍历一次即可计算所需的所有值。代码如下:def getStatistics(data: DataFrame): (java.util.HashMap[String, Long], java

2017-06-01 20:22:23 4852 1

Qt+Creator快速入门

Qt Creator快速入门 书比较大,分卷压缩的,解压时, part1和part2放在一起.本书是要讲解Qt creator开发环境的使用和Qt基本知识点的应用,适合没有Qt编程基础、有Qt编程基础但是没有形成知识框架以及想学习Qt中某一方面应用的读者阅读。

2014-10-14

Socket MFC简单聊天

Socket MFC简单聊天室 分为client和server项目

2013-08-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除