- 博客(6)
- 收藏
- 关注
原创 分布式消息系统kafka单节点搭建
一、准备sbt-0.13.7.tgz下载地址:http://www.scala-sbt.org/download.htmlkafka_2.9.2-0.8.1.1.tgz下载地址:https://www.apache.org/dyn/closer.cgi?path=/kafka/0.8.1.1/kafka_2.9.2-0.8.1.1.tgzslf4j-1.7.2.zip下载地址:
2014-12-24 16:05:43 1669
转载 分布式消息系统Kafka初步
终于可以写kafka的文章了,Mina的相关文章我已经做了索引,在我的博客中置顶了,大家可以方便的找到。从这一篇开始分布式消息系统的入门。在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题: l 我想分析一下用户行为(pageviews),以便我能设计出更好的广告位 l 我想对用户的搜索关键词进行统计,分析出当前的流行趋势。这个很有意思,在经济学上有
2014-12-24 16:01:56 540
原创 Mahout初探(一)
Supported AlgorithmsClassification Logistic Regression(SGD)BayesianSupport Vector Machines(SVM)Perceptron and WinnowNeural NetworkRandom ForestsRestricted Boltzmann Machine
2014-12-08 18:59:48 598
转载 国外程序员整理的机器学习资源大全
看到这么好的资源,忍不住转载了,供大家一起学习!本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统
2014-12-08 17:59:41 1014
转载 linux下安装maven
1、 下载地址http://maven.apache.org/download.html2、 安装1) 上传到服务器使用命令解压:tar –xzvf apache-maven-3.0.4-bin.tar.gz2) 使用root用户来安装给所有用户使用在/etc/profile文件中配置增加如下变量MAVEN_HOME=” /usr/local/apache-ma
2014-12-08 17:52:40 485
转载 两款高性能并行计算引擎Storm和Spark比较
Spark基于这样的理念,当数据庞大时,把计算过程传递给数据要比把数据传递给计算过程要更富效率。每个节点存储(或缓存)它的数据集,然后任务被提交给节点。所以这是把过程传递给数据。这和Hadoop map/reduce非常相似,除了积极使用内存来避免I/O操作,以使得迭代算法(前一步计算输出是下一步计算的输入)性能更高。Shark只是一个基于Spark的查询引擎(支持ad-hoc临时性的分析
2014-12-08 17:43:05 549
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人