自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 个人R学习笔记

好久不用就会生疏,最近重学R,用的是《R语言实战》,记一些笔记。。。1.矩阵 ( matrix )假设 > x  > x     [,1]   [,2]  [,3]  [,4]  [,5][1,]    1    3    5    7    9[2,]    2    4    6    8   10那么> x[1, c(4,5) ]是矩阵

2017-04-05 18:08:16 284

原创 用python在hadoop上运行wordcount

1.gedit wordcount_mapper.pygedit wordcount_reducer.py2.chmod 775 wordcount_mapper.pychmod 775 wordcount_reducer.py3.上传测试文件到HDFShadoop fs -put testfile1 input/pyhadoop fs -put t

2015-12-14 16:07:24 1138

原创 spark+python学习笔记感想

上周终于把coursera上的一门数据课程结束了,并且通过了,周四根据课程assignment做的实验印象很深,觉得有必要记下来。Hadoop Platform and Application Frameworkby University of California, San Diegohttps://www.coursera.org/learn/hadoop/home

2015-12-14 16:06:26 1744

原创 hadoop+mahout 建立决策树实验的问题

12/3今天再战决策树,用的还是KDDTrain数据集然后今天实验感觉快成功了, 首先这是这样的1.hadoop jar mahout-examples-0.7-job.jar org.apache.mahout.classifier.df.mapreduce.BuildForest -Dmapred.max.split.size=1874231 -d dttest/inp

2015-12-03 15:30:15 795

原创 大数据兴趣相关

今天发现了个数据来源,非常有意思,可以从他人的作品里面看到别人做得如何的好,看完了让我更有奋斗的方向http://www.bayareabikeshare.com/open-data大概是San Francisco的自行车租借数据,记录了相关的各种数据,而且数据是公开的,可以拿来自己做分析,里面看到别人的作品都非常厉害。其中一个人的作品,数据可视化,记录了最常用的几个租

2015-11-27 14:53:55 314

原创 Python学习笔记(1)

为了做Coursera上的作业,我需要学习Python来写代码,以前就有过想要学习Python的想法,现在马上行动这次是在另外一个学习网站上:dataquest 上学习的,相比datacamp上的R教程,这个我觉得还不太习惯,虽然两个网站看起来是一家做的,但是帐号不通用。。贴上API中文文档,感谢他们的付出http://python.usyiyi.cn/python_2

2015-11-27 14:53:03 378

原创 R 学习笔记( 2 )

今天开始 继续学习R ,进入Intermediate(中级) R部分这次是运算符部分1.!=  和 == 同样适用于R里面2.TRUE ==1 , FALSE == 03.对于数组中的数同样可以使用运算符 ,具体用法如下:# The linkedin and facebook vectors have already been created for y

2015-11-27 14:52:12 654

原创 个人Hadoop实验决策树算法学习笔记

参考的文章:http://blog.csdn.net/fansy1990/article/category/1313502http://blog.csdn.net/ashqal/article/details/20915431错误1:File does not exist: /user/jxxy/input/dttest/kddTrain.txt上传的目

2015-11-24 16:50:40 769

原创 学习Hadoop中的几个问题

1.eclipse配置hadoop插件参考链接,我在这里学到的:http://www.micmiu.com/bigdata/hadoop/hadoop2-x-eclipse-plugin-build-install/感谢前辈的指导注1:在eclipse上测试wordcount中的几个注意的地方·编写好测试的文档后要上传到HDFS上 如果文件夹(在hadoop目录下)是inp

2015-11-19 18:29:24 422

翻译 hadoop 学习笔记(1)

在Coursera上学习的一门课程  :Hadoop Platform and Application Frameworkby University of California, San Diegohttps://www.coursera.org/learn/hadoop/home/welcome里面讲得很好,就是我这边的网下不下来一个cloudera的软件,我也正在学

2015-11-17 20:22:01 368

原创 个人R语言学习笔记(1)

我在 www.datacamp.com 上面的免费课程学习R 语言, 现在刚开始入门 ,记下一些函数的笔记,以后往数据分析/挖掘发展vector:sum( ): It calculates the sum of all elements of a vector 计算向量里面所有元素的总个数total_poker > 和answer total_roulette

2015-11-15 12:18:44 480

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除