技术--大数据
文章平均质量分 67
beijicy
这个作者很懒,什么都没留下…
展开
-
虚拟机中伪分布式Hadoop的部署
本文介绍了在Mac本 + VMWare Fusion + CentOS 64环境下安装jdk和hadoop的步骤原创 2015-11-08 11:05:14 · 486 阅读 · 0 评论 -
图数据库NEO4j
neo4j是一个很牛逼的图数据库,这里是简单的介绍和例子原创 2016-07-14 17:26:04 · 938 阅读 · 0 评论 -
一个简单的数据质量检查和汇总工具——Profiler
Profiler工具用了一下,不能覆盖大数据量的情况原创 2016-07-10 14:26:02 · 2834 阅读 · 0 评论 -
【诸葛干货】爬虫入门-基础理论篇(下篇)
【诸葛干货】爬虫入门-基础理论篇(下篇)转载 2016-04-07 21:14:45 · 437 阅读 · 0 评论 -
【诸葛干货】一看就明白的爬虫入门-基础理论篇(上篇)
【诸葛干货】一看就明白的爬虫入门-基础理论篇(上篇)转载 2016-04-07 21:14:04 · 535 阅读 · 0 评论 -
你是不也在愁没数据?来看看Open Data吧!
可以到这里看看你想要什么数据转载 2016-03-31 10:34:44 · 2240 阅读 · 0 评论 -
scala中的常用语法(下)
占位占位占位占位占位占位占位原创 2016-02-01 11:20:29 · 369 阅读 · 0 评论 -
scala中的apply和unapply
本文讲解scala中的apply和unapply的使用方法转载 2016-02-01 11:23:43 · 4629 阅读 · 0 评论 -
scala中的常用语法(上)
scala的常用语法原创 2016-01-26 16:52:12 · 511 阅读 · 0 评论 -
scala下AKKA第一个示例
scala下使用akka的第一个示例程序转载 2016-01-26 14:39:58 · 10739 阅读 · 0 评论 -
Kafka背景及架构介绍
以下内容转自:http://www.infoq.com/cn/articles/kafka-analysis-part-1=============================================Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Ap转载 2015-11-10 11:24:25 · 367 阅读 · 0 评论 -
Kafka快速部署
以下内容分享自:http://colobu.com/2014/08/06/kafka-quickstart/========================================================第一步: 下载代码下载 0.8.1 版本并解压。 (当前最新的稳定版本是0.8.1.1)12> tar -xzf kaf转载 2015-11-10 11:29:10 · 708 阅读 · 0 评论 -
HIVE的ACID特性
HIVE0.14支持update、delet原创 2016-07-06 10:51:12 · 1816 阅读 · 0 评论