Spark
文章平均质量分 73
pegaxux
这个作者很懒,什么都没留下…
展开
-
Spark学习之adaboost
决心不再拖延了(说的和真的一样),开始准备做毕业设计吧。毕设的题目是《基于Spark并行架构分类算法的研究与实现》,听起来好像好难的样子,就这么往坑里跳了。那么首先,照学长说的,开始了解一些大数据的分类算法相关知识。 首先是Adaboost,按照惯例百度之,找到这篇文章AdaBoost算法简介及入门,看起来不错,纵向介绍了一下这一类概念的发展历程,其中出现了分类器一词,较为陌生,了解了一下,下原创 2015-03-06 19:18:42 · 1801 阅读 · 0 评论 -
spark学习之WordCount测试
今天做的是hadoop中wordcount的测试。那么对unix等等不熟悉的我渐渐觉得坑有点深了,呵呵。 Hadoop2.6.0的环境是老早就搭好了的,首先启动它吧,唉start-all.sh命令也不知怎么就弃用了,只写一句多方便啊,现在的规范用法是start-dfs.shand start-yarn.sh。好的启动完成,这一次简单地使用一下bin/hdfsdfs命令。原创 2015-03-10 14:34:46 · 853 阅读 · 0 评论