Simon Ellist..
5
最简单的入门方法是在Azure上使用HDInsight服务(仍在预览中,但效果很好).这样您就可以登录您的天蓝色门户并启动一个群集,该群集将链接到您的天蓝色存储.
如果您真的不想访问云,那么您可以通过Web平台安装程序下载HDInsight开发人员预览包,这将创建单节点本地群集.或者,如果您对'just hadoop'感兴趣,那么您可以尝试使用Hortonworks或Cloudera提供的VM.
在那之后,如果您熟悉SQL,那么可能值得从Hive开始.在O'Reilly的权威指南的Hadoop是对相当不错的.
从.NET的角度来看,codeplex上的hadoopsdk是一个很好的起点.
至于非常基本的连接示例,请尝试使用此博客作为示例,但请注意,HDInsight的连接略有不同,现在它们全部使用了templeton接口,因此这将让您前进:
var db = new HiveConnection(
webHCatUri: new Uri("http://localhost:50111"),
userName: (string) "hadoop", password: (string) null);
var result = db.ExecuteHiveQuery("select * from w3c");
如果您希望在HDInsight上完成MapReduce,那么您可能希望在codeplex上查看带有sdk的C#MapReduce示例.
请注意,默认的HDInsight安装还附带了一些很好的示例,其中包括一些可以使用的数据以及一些PowerShell脚本和.NET代码,以帮助您入门.
请享用!