Hadoop2.7.0+与Spark1.5+已将不支持JDK1.6

摘要:Hadoop2.7.0已发发布,但该版本已经不支持JDK1.6版本,由于该版本吸取了很多JIRAs,考虑到Bug还在测试中,请暂时不要使用该版本用于生产环境,可以用Hadoop 2.7.1/2.7.2,版本的更新应该很快发布。Spark社区激烈讨论决定,预计2015年6月发布Spark1.4...

2015-05-06 11:24:10

阅读数 1853

评论数 0

PostgreSQL(数据库)资料和分布式系统(Distributed System)资料与Go语言资料整理

《PostgreSQL Documentation》 介绍:PostgreSQL官方文档主页 《PG技术沙龙ppt》 介绍:2013年4月PG技术沙龙PPT 《PG9.3中文翻译文档》 介绍:PG9.3中文翻译文档 谢谢@skykiker提供 《PostgreSQL从菜鸟到专家(中译稿...

2015-04-28 13:02:17

阅读数 3224

评论数 0

【重磅干货整理】机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总

《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning. 《Deep Learning in Neural Networks: An O...

2015-04-28 10:17:32

阅读数 24097

评论数 10

机器学习界大牛林达华推荐的书籍(Recommended Books)

Here is a list of books which I have read and feel it is worth recommending to friends who are interested in computer science. Machine Learning ...

2015-03-04 23:35:01

阅读数 1847

评论数 2

[置顶] 各大推荐引擎资料汇总

视频类 Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师兄的blog。 Hulu:主要是item based CF,参考官方博客上的文章。 Youtube:开始是random walk,后来改为类似item based CF的方法,这是他们算法团队发...

2015-02-25 16:23:00

阅读数 828

评论数 0

VMware WorkStation11的三种网络连接方式详解与NAT模式下静态IP配置(Ubuntu12.04版本)

第一部分:与VMware网络连接相关的知识 安装完VMware WorkStation虚拟机后,默认安装了两个虚拟网卡,VMnet1和VMnet8,其他的未安装(当然也可以手动安装其他的)。其中VMnet1是host网卡,用于host方式连接网络的。VMnet8是NAT网卡,用于NAT方式连接网络...

2015-01-26 17:38:09

阅读数 4883

评论数 0

2014 Spark美国峰会顶级数据商精彩PPT分享

Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用的语言是Scala,项目的核心部分的代码只有63个Scala文件,非常短小精悍。 Spark 是一种与 Hadoop 相似的开源集群计...

2015-01-22 14:49:37

阅读数 877

评论数 0

聊聊HTTPS和SSL/TLS协议

要说清楚 HTTPS 协议的实现原理,至少需要如下几个背景知识。 1. 大致了解几个基本术语(HTTPS、SSL、TLS)的含义 2. 大致了解 HTTP 和 TCP 的关系(尤其是“短连接”VS“长连接”) 3. 大致了解加密算法的概念(尤其是“对称加密与非对称加密”的区别) 4. 大致...

2015-01-15 11:23:00

阅读数 638

评论数 0

Scala开发入门教程【整理来自引路蜂Blog】

Scala语言和其它语言比如Java相比,算是一个比较复杂的语言,它是一个面向对象和面向函数的统一体,使用起来非常灵活,因此也不容易掌握,前面的58篇文章仅仅是Scala的一个入门教程,有了这些基础知识,你就可以开始编写Scala应用,学习一种语言最好的方法是通过实践来学习。为方便起见,下面列出这...

2015-01-14 20:47:28

阅读数 1247

评论数 1

高清视频录制工具(Bandicam)v2.1.2.740中文使用技巧

Bandicam 一款由韩国开发的高清录制视频的工具,Bandicam 的优势在于对电脑配置要求低,一些配置比较低端的电脑,通常录制视频会出现不同步现象,使用 Bandicam 就可以避免此问题。Bandicam录制的视频体积小,而且画面清晰,可以录制分辨率高达2560×1600高画质视频(108...

2015-01-12 17:13:00

阅读数 2446

评论数 0

【转自oschina网站】Hadoop、Pig、Hive、Storm、NOSQL 学习资源收集

目录[-] (一)hadoop 相关安装部署 (二)hive (三)pig (四)hadoop原理与编码 (五)数据仓库与挖掘 (六)Oozie工作流 (七)HBase (八)flume (九)sqoop (十)ZooKeeper (十一)NOSQL (十二)Had...

2015-01-04 22:09:40

阅读数 1941

评论数 2

用Windows7+IDEA+SBT搭建Spark源代码调试与阅读环境

Spark源码是有Scala语言写成的,目前,IDEA对Scala的支持要比eclipse要好,大多数人会选在在IDEA上完成Spark平台应用的开发。因此,Spark源码阅读的IDE理所当然的选择了IDEA。今天将与大家分型Windows7+IDEA+SBT搭建Spark源代码调试与阅读环境。 ...

2015-01-04 21:48:55

阅读数 7080

评论数 0

用IDEA创建sbt的Scala工程

Spark源码是有Scala语言写成的,目前,IDEA对Scala的支持要比eclipse要好,大多数人会选在在IDEA上完成Spark平台应用的开发。下面我们以IDEA创建一个Scala项目。   实验环境准备: l  JDK: Java 语言的软件开发工具包(SDK) 参考网址: ht...

2015-01-04 21:34:28

阅读数 5018

评论数 0

用Eclipse构建Spark源代码调试阅读环境

实验环境准备: l  JDK: Java 语言的软件开发工具包(SDK) 参考网址: http://www.oracle.com/technetwork/java/javase/downloads/index.html l  SaclaIDE:一个基于Eclipse开发的Scala的集成开发...

2015-01-04 21:26:37

阅读数 6810

评论数 0

BAT的薪资待遇大解密

三大互联网巨头公司,百度腾讯跟阿里如何划分级别?薪资待遇又有多少?除非身居其位,否则很难探知,但是等你到那个位置知道了,却又不能说,至少不能在公开场合谈论。接下来就为大家揭秘,百度、阿里与腾讯内部的级别划分跟薪资待遇。这是一个群众喜闻乐见却又讳莫如深的话题。 各个公司头衔名字都不一样,级别的...

2015-01-04 21:14:53

阅读数 2000

评论数 0

推荐!国外程序员整理的机器学习资源大全

本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。 C++ 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, ...

2014-12-29 21:01:52

阅读数 1501

评论数 0

如何使用Maven和eclipse构建大数据开发框架项目

作为大数据开发者,特别是开发大数据应用程序的程序员或者框架师,在进行大数据项目开发,或者是研读源代码,的把相应的项目导入到集成开发环境,本文用Maven和eclipse来构建大数据开发框架项目。比如说开发storm项目、Hadoop项目、Spark项目等,本文以构建storm项目为例进行图文解读。...

2014-12-29 20:43:16

阅读数 2229

评论数 0

Mahout学习资料

mahout源码研究--参考资料: http://blog.csdn.net/zhouhong1026/article/details/19991435 基于Mahout的电影推荐系统: http://blog.csdn.net/huhui_cs/article/detail...

2014-12-27 22:21:40

阅读数 654

评论数 0

BDTC2014中国大数据技术大会

2014中国大数据技术大会32位核心专家演讲PDF下载汇总(重磅资料)下载地址: http://download.csdn.net/detail/zhongwen7710/8295907 2014中国大数据技术大会32位核心专家演讲PDF目录题目如下: 1、高速网络Infin...

2014-12-24 19:25:53

阅读数 2234

评论数 3

汇总从代数角度与几何角度理解相似度计算方法(以机器学习Mahout框架为主线)

相似度的计算是数据挖掘与机器学习中的一个永恒的话题,为了能更好地理解与比较各种相似度计算的方法,能灵活运用到各种计算模型中,自己在研究机器学习之Mahout框架时,源代码中也实现了很多相似度计算方法,本文结合机器学习Mahout框架中各种相似度计算方法的实现,并且从代数角度和几何角度来理解相似度的...

2014-12-22 22:57:37

阅读数 4115

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭