- 博客(6)
- 收藏
- 关注
转载 2014年值得关注的十个Hadoop大数据创业公司
2014年值得关注的十个Hadoop大数据创业公司开源大数据框架Apache Hadoop已经成了大数据处理的事实标准,同时也几乎成了大数据的代名词,虽然这多少有些以偏概全。根据Gartner的估计,目前的Hadoop生态系统市场规模在7700万美元左右,2016年,该市场规模将快速增长至8.13亿美元。但是在Hadoop这个快速扩增的蓝海中游泳并非易事,不仅开发大数据
2014-05-29 13:55:18 785
原创 Linux下nutch1.8-bin部署及问题总结
Nutch1.8:基本环境搭建和使用Nutch是一个开源的搜索引擎,包括抓取、索引、搜索,不过主要是抓取。说明:Nutch有两个主版本1.X和2.X,主要区别是2.X引入了存储抽象层,从而支持各种NoSQL数据库,如HBase、Cassandra等。本文介绍1.8版本。环境准备:Linux服务器,可以装在VMware虚拟机中。下载Nutch1.8,有src和bin两种包
2014-05-23 16:05:53 2107 4
转载 Windows下Nutch的使用
Nutch使用方法简介 目前Nutch采用Sehll的启动方式,如果您使用的是Windows系统,那么首先需要安装Cygwin。本文就以在Windows中为例,介绍Nutch的安装和使用方法。 (1)准备需要的软件列表 Cygwin (下载地址:http://www.cygwin.com/setup.exe) Jdk(1.4.2以上版本,
2014-05-23 13:46:58 769
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人