自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(95)
  • 收藏
  • 关注

原创 龟云狄眦-Scala学习札记【二】Scala中lambda表达式的使用

Lambda 表达式初见

2017-08-03 22:21:53 2950

原创 蜗龙徒行-Spark学习笔记【五】IDEA中集群运行模式的配置

IDEA中集群运行模式的配置

2017-07-31 23:59:11 1262 1

原创 龟云狄眦-Scala学习札记【一】Scala中class、object、trait初识

Scala中class、object和trait的区别

2017-07-30 18:42:47 406

原创 Hadoop小兵笔记【六】hadoop2.2.0伪分布式环境搭建疑难-JobHistory显示Job信息为空

Hadoop本地模式竟然看不了Jobistory,只有集群模式下才可以!!!

2017-07-28 23:09:35 988 1

原创 Hadoop小兵笔记【五】hadoop2.2.0伪分布式环境搭建疑难-第一个用例wordcount失败

hadoop环境成功与否取决于配置文件是否配置正确,另外,hadoop分布式文件系统的原理还需要进一步研究,要知其然,知其所以然。

2017-07-26 22:51:38 504

原创 Hadoop小兵笔记【四】hadoop2.2.0伪分布式环境搭建问题-ssh登录失败

本文记录了基于Hadoop2.2.0搭建伪分布式环境过程中遇见的疑难问题,并给出解决方案,详记于此,以为后观。问题引子File /data/input/wordcountTest.COPYING could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datanode(s) running an

2017-07-23 20:22:55 337

转载 Ubuntu 12.04 LTS忘记密码

Ubuntu 12.04 LTS忘记密码忘记密码是一件很头疼的事儿,LINUX通过单用户模式可以很轻松帮助你想要改变用户密码。但系统为Ubuntu 12.04 LTS 版本不一样。Ubuntu 12.04 LTS 进入单用户模式步骤: 1、开机到grub时,用上下键移到第二行的恢复模式,按e(注意不是回车) 即Ubuntu,With Linux 3.2.0-29-generic(recovery

2017-07-12 22:00:27 385

转载 Hadoop小兵笔记【三】利用Eclipse将wordcount打包成可以运行在hadoop上的jar包

hadoop版本为hadoop1.2.1eclipse版本为eclipse-standard-kepler-SR2-win32-x86_64WordCount.java为hadoop-1.2.1\src\examples\org\apache\hadoop\examples\WordCount.java 1 /** 2 * Licensed under t

2015-05-04 16:14:10 3289

原创 蜗龙徒行-Spark学习笔记【四】Spark集群中使用spark-submit提交jar任务包实战经验

所遇问题:由于在IDEA下可以方便快捷地运行scala程序,所以先前并没有在终端下使用spark-submit提交打包好的jar任务包的习惯,但是其只能在local下执行,在网上搜了好多帖子都不能启动spark集群,由于实验任务紧急只能暂时作罢IDEA下任务提交,改由终端下使用spark-submit提交打包好的jar任务。

2015-04-14 16:27:53 7220

原创 Hadoop小兵笔记【二】Hadoop分布式集群扩展实战经验

Hadoop分布式集群扩展实战经验

2015-04-14 13:23:20 1130

原创 蜗龙徒行-Spark学习笔记【三】Spark集群中worker节点扩展实战经验

Spark集群中worker节点扩展经验

2015-04-14 11:22:42 2178

转载 数据挖掘学习笔记--系统聚类法和K均值聚类法

一.系统聚类法 1.基本思想将模式样本按距离准则逐步分类,类别由多到少,直到获得合适的分类要求为止。算法:第一步:设初始模式样本共有N个,每个样本自成一类,即建立N类,。计算各类之间的距离(初始时即为各样本间的距离),得到一个N*N维的距离矩阵D(0)。这里,标号(0)表示聚类开始运算前的状态。第二步:假设前一步聚类运算中已求得距离矩阵D(n),n为

2015-04-09 20:20:00 9310

转载 机器学习中的相似性度量标准

在做聚类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。  本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯

2015-04-08 17:03:33 660

原创 蜗龙徒行-Spark学习笔记【二】Spark shell下kmeans聚类算法的应用

在终端打开spark-shell然后在scala编辑模式下依次输入以下命令://导入算法执行所需函数库import org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectors// 加载并分析数据val data = sc.textFile("data

2015-03-26 12:07:36 2259

转载 scala常用语法总结

Clojure首先是FP, 但是由于基于JVM, 所以不得已需要做出一些妥协, 包含一些OO的编程方式 Scala首先是OO, Java语法过于冗余, 一种比较平庸的语言, Scala首先做的是简化, 以更为简洁的方式来编写OO, 主要利用‘type inference’能推断出来的, 你就不用写, 但如果仅仅这样, 不如用python 所以Scala象其名字一样, “可伸展的语言”, 它

2015-03-06 09:16:22 1298

转载 Windows + IDEA + SBT 打造Spark源码阅读环境

转自:http://www.guozhongxin.com/pages/2014/10/15/spark_source_code.htmlSpark源码阅读环境的准备Spark源码是有Scala语言写成的,目前,IDEA对Scala的支持要比eclipse要好,大多数人会选在在IDEA上完成Spark平台应用的开发。因此,Spark源码阅读的IDE理所当然的选择了IDEA。

2015-01-30 15:42:11 893

转载 Ubuntu学习札记【四】Ubuntu 12.04 在root登陆之后没有声音的解决方法

Ubuntu在root用户下,为了安全考虑默认是关闭了声音系统的。如果要开很简单,因为root登录后pulseaudio没有启动。所以要先启动它。        【1】将root加到pulse和pulse-access组:                  sudo usermod -a -G pulse-access root                  gpasswd -a

2015-01-21 16:42:21 634

原创 搭建基于hadoop 2.2.0的分布式集群启动时出现 "Unable to load native-hadoop library for your platform" 的解决方案

问题引出:        搭建基于hadoop 2.2.0的分布式集群完成后,为了测试hadoop分布式集群,启动时执行命令: {HADOOP_HOME}/sbin/start-dfs.sh,经常会看到如下提示:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using

2015-01-20 18:36:02 796

原创 蜗龙徒行-Spark学习笔记【一】初识Spark形成、演进、发展

【一】Hadoop版本演进过程           由于Hadoop1.X 以前版本在 MapReduce 基本构架的设计上存在作业主控节点(JobTracker)单点瓶颈、作业执行延迟过长、编程框架不灵活等较多的缺陷和不足,2011 年 10 月,Hadoop 推出了基于新一代构架的 Hadoop0.23.0 测试版,该版本系列最终演化 为Hadoop2.0 版 本, 即 新 一 代 的 H

2014-12-15 20:58:14 809

转载 Hadoop小兵笔记【一】Hadoop安装过程中core-site.xml,hdfs-site.xml,mapred-site.xml配置文件详解

在搭建hadoop开发环境的时候,需要对hadoop进行配置,其中Hadoop1.x的配置文件放在{hadoop_home}/conf目录下,Hadoop2.x的配置文件放在{hadoop_home}/etc目录下,主要有core-site.xml,hdfs-site.xml,mapred-site.xml这几个文件。       但是后来想到一个问题,hadoop的配置信息只有这么一点点吗?

2014-12-09 20:43:43 9621

原创 Linux操作系统下常用命令集锦【一】查询进程对应信息Lsof命令详解

问题引出:配置单机版的hadoop2.6.0后使用jps没有jobtracker和tasktracker ?解决方法:配完后使用jps查看,发现总是有一些没有启动,非常郁闷,在多番研究后发现有两个原因:一个是在/tmp目录下有以前使用2.02版本留下的文件没有删除,删除/tmp下所有文件即可;二个是因为端口被占用了,先用lsof查找对应端口是否被占用,若被占用可以用kill命令杀死该进

2014-12-09 10:49:50 572

转载 hadoop2.2完全分布式最新高可靠安装文档

hadoop2.2完全分布式最新高可靠安装文档   问题导读:1.如何配置各个节点之间无密码互通?2.启动hadoop,看不到进程的原因是什么?3.配置hadoop的步骤是什么?4.有哪些配置文件需要修改?5.如果没有配置文件,该如何找到该配置文件?6.环境变

2014-12-04 18:32:55 581

原创 MOOC学院之Machine Learning学习笔记【第一讲】

【1】机器学习的定义          亚瑟·塞穆尔将机器学习定义为 在没有明确为计算机编写(完成某项具体任务的)

2014-11-25 09:19:17 743

原创 Ubuntu学习札记【综合篇】

【1】ubuntu 12.04 怎么卸载程序?

2014-11-13 09:33:45 504

原创 Ubuntu学习札记【三】Ubuntu 12.04下安装JDK1.8.0_25

JDK版本:1.7.0_04安装目录:/usr/local/development/jdk1.7.0_04安装JDK1.7的过程1. 打开网址http://www.Oracle.com/technetwork/java/javase/downloads/jdk-7u4-downloads-1591156.html,下载相应的JDK文件。2. 将下载的文件解压缩到/usr/loc

2014-11-12 22:33:13 882

原创 Ubuntu学习札记【二】Ubuntu 12.04软件中心安装flash插件过程失败解决办法

疑难引出:由于ubuntu下使用WebQQ不能传送文件,于是就想到安装wine(可以在 Linux,BSD,Solaris 和 Mac OS X 上运行 Windows 应用)来使用QQ,使用apt-get install命令安装,但是安装到一部分时出现卡死情况如下:正在设置 update-notifier-common (0.119ubuntu8.1) ...flashplugin-installer: downloading http://archive.canonical.com/pool/par

2014-11-11 09:25:27 879

原创 Ubuntu学习札记【一】ubuntu 12.04 LTS 如何使用更快的更新源流程详解

装好ubuntu系统后的第一见事就是替换自带的更新源,原因是系统自带的源有些在中国访问不了,可以访问的速度又特别慢。幸好国内的一些公司和大学提供了速度不错的更新源。

2014-11-10 21:10:13 646

原创 华科校园网内ubuntu12.04用锐捷客户端联网流程详解

华科校园网内ubuntu12.04用锐捷客户端联网流程详解

2014-11-04 19:13:31 5477

原创 SDD+HDD+Win7+Ubuntu12.04双硬盘双系统安装流程

SDD+HDD+Win7+Ubuntu12.04双硬盘双系统安装流程详解

2014-11-04 15:05:03 7844

转载 中缀表达式求值问题

中缀表达式求值问题  中缀表达式的求值问题是一个比较常见的问题之一,我们通常在编写程序时,直接写出表达式让编译器去处理,很少去关心编译器是怎么对表达式进行求值的,今天我们来一起了解一下其中具体的原理和过程。  表达式一般来说有三种:前缀表达式、中缀表达式、后缀表达式,其中后缀表达式又叫做逆波兰表达式。中缀表达式是最符合人们思维方式的一种表达式,顾名思义,就是操作符在操作数的中间。而前缀表达

2014-09-13 19:35:37 722

转载 unix下fork()函数用法详解

题目:请问下面的程序一共输出多少个“-”?#include #include #include intmain(void){inti;for(i=0; ifork();printf("-");}return0;}如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-

2014-09-07 10:15:55 674

转载 Java的内存回收机制

在Java中,它的内存管理包括两方面:内存分配(创建Java对象的时候)和内存回收,这两方面工作都是由JVM自动完成的,降低了Java程序员的学习难度,避免了像C/C++直接操作内存的危险。但是,也正因为内存管理完全由JVM负责,所以也使Java很多程序员不再关心内存分配,导致很多程序低效,耗内存。因此就有了Java程序员到最后应该去了解JVM,才能写出更高效,充分利用有限的内存的程序。1

2014-09-03 10:01:28 436

转载 操作系统中存储管理的基本原理

存储管理的基本原理内存管理方法内存管理主要包括内存分配和回收、地址变换、内存扩充、内存共享和保护等功能。下面主要介绍连续分配存储管理、覆盖与交换技术以及页式与段式存储管理等基本概念和原理。1.连续分配存储管理方式连续分配是指为一个用户程序分配连续的内存空间。连续分配有单一连续存储管理和分区式储管理两种方式。(1)单一连续存储管理在这种管理方式

2014-09-03 09:31:13 3634

转载 进程通信机制概述

一、进程间通讯概述1. 目的(为什么进程间需要通信?)1)数据传输:一个进程需要将它的数据发送给另一个进程。2)资源共享:多个进程之间共享同样的资源。3)通知事件:一个进程需要向另一个或一组进程发送消息,通知它们发生了某种事件。4)进程控制:有些进程希望完全控制另一个进程的执行(如Debug进程),此时控制进程希望能够拦截另一个进程的所有操作,并能够及时知道

2014-09-03 09:18:29 597

转载 矩阵(稀疏矩阵)的压缩存储

35、矩阵(稀疏矩阵)的压缩存储(一) 2010-01-11 13:25:26| 分类: 算法及分析|举报|字号 订阅为了节省存储空间并且加快处理速度,需要对这类矩阵进行压缩存储,压缩存储的原则是:不重复存储相同元素;不存储零值元素。一、相关概念㈠特殊矩阵:矩阵中存在大多数值相同的元,或非0元,且在矩阵中的分布有一定规律。⒈对称矩阵:矩阵中的元素满足

2014-09-03 08:36:41 2309

转载 c++ 空类大小不为0的原因

#includeusing namespace std;class a{};class b{};class c:public a{ virtual void fun()=0;};class d:public b,public c{};int main(){ cout<<sizeof(a)<<endl; cout<<sizeof(b)<<endl; cout<<si

2014-08-28 09:12:04 581

转载 Git版本控制软件结合GitHub从入门到精通常用命令学习手册

Git版本控制软件结合GitHub从入门到精通常用命令学习手册 软件应用 爱分享  1周前 (08-15)  644浏览  0评论注意:学习前请先配置好Git客户端相关文章:Git客户端图文详解如何安装配置GitHub操作流程攻略官方中文手册:http://git-scm.com/book/zhGIT 学习手册简介本站

2014-08-26 10:51:47 1693

原创 简述C语言中宏的作用及其副作用

引问:写一个“标准”宏MIN,这个宏输入两个参数并返回较小的一个?若是 least = MIN(*p++, b);又有何副作用?

2014-08-22 17:19:08 3641

原创 WORD文档误删除、误清空等恢复的几种方法

WORD文档误删除、误清空等恢复的几种方法

2014-08-22 12:52:50 6007

转载 C++类与C#类区别详述

C++的类与C#的类一、简介 面向对象(OO)编程在应用设计中已经发展二十来年了。程序不再是一系列函数的堆彻(象一些范例那样的程序),而是对象的集合,每个对象都有其独特的属性和方法来与其它对象打交道。"C"语言系列是面向对象设计发展的最好例子。C++为开发者提供了优秀的面向对象编程工具,程序员可以显式地创建构造函数,拷贝构造函数,重载操作符,使用模板等等。 象C++这样

2014-08-20 20:39:33 566

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除