自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Gatherfly 的博客

记录自己学习过程中遇到的问题及解决方案,让自己每天进步一点点……

  • 博客(38)
  • 收藏
  • 关注

转载 分布式服务框架Zookeeper介绍、原理及应用

转载自:http://www.jianshu.com/p/bf32e44d3113Zookeeper简介  Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等等。Zookeeper基本概念zk角色  Zookee

2017-08-09 17:52:08 598

转载 深入理解 Java 垃圾回收机制

一:垃圾回收机制的意义java  语言中一个显著的特点就是引入了java回收机制,是c++程序员最头疼的内存管理的问题迎刃而解,它使得java程序员在编写程序的时候不在考虑内存管理。由于有个垃圾回收机制,java中的额对象不在有“作用域”的概念,只有对象的引用才有“作用域”。垃圾回收可以有效的防止内存泄露,有效的使用空闲的内存; 内存泄露:指该内存空间使用完毕后未回收,在不涉及复杂

2017-02-24 13:59:05 578

转载 Linux 正则表达式详解

Linux 正则表达式详解转自:http://www.jb51.net/article/42989.htm这篇文章主要介绍了linux 正则表达式的一些使用方法,需要的朋友可以参考下一.linux文本查找命令在说linux正规表达式之前,还介绍下linux中查找文本文件常用的三个命令:1.grep : 最早的文本匹配程序,使用POSIX定义的基本正则

2016-11-04 15:07:44 651

转载 UML类图的几种关系

在UML类图中,常见的有以下几种关系: 泛化(Generalization),  实现(Realization),关联(Association),聚合(Aggregation),组合(Composition),依赖(Dependency)         1. 泛化(Generalization)        【泛化关系】:是一种继承关系,表示一般与特殊的关系,它指定了子类如何特化父类的

2016-09-18 21:24:31 457

转载 面向对象设计七大原则

面向对象设计七大原则1. 单一职责原则(Single Responsibility Principle)每一个类应该专注于做一件事情。2. 里氏替换原则(Liskov Substitution Principle)超类存在的地方,子类是可以替换的。3. 依赖倒置原则(Dependence Inversion Principle)实现尽量依赖抽象,不依赖具体实现。4. 接

2016-09-18 16:10:53 821

原创 求各种进制下,各位数之和的平均值

算法题:将一个整型数据A,可以分别转换为二进制,三进制,……,A-1进制的数,例如整数7,二进制111;三进制21;四进制13,;五进制12;六进制11。所有进制数的各个位数字之和不尽相同,现求其平均值,即整型数据转换成的所有进制数,各位数之和的平均值。Java代码实现如下:import java.util.Calendar;import java.util.Scanner;pu

2016-09-08 16:33:27 1896

转载 短作业优先调度算法(SJF)——Java实现

短作业优先调度算法(SJF)        短作业优先调度算法(Short Job First)用于进程调度时又被称为短进程优先调度算法(Short Process First),该算法既可以用于作业调度,又可以用于进程调度。        在作业调度中,该算法每次从后备作业队列中挑选估计服务时间最短的一个或几个作业,将他们调入内存,分配必要的资源,创建进程并放入就绪队列。在进程调度中

2016-09-08 16:06:19 11360 1

转载 SSH连接虚拟机中的Ubuntu

使用的远程工具是putty(下载地址:http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html)。具体步骤:(主要引用来源:http://www.linuxidc.com/Linux/2014-04/99728.htm)1、网络既然要远程ubuntu的系统、那么首先是两个网络是不是在一个网段、能不能ping通

2016-08-26 11:46:32 738

原创 word2vec使用有感

近期考虑使用Google研发的一款基于Deep Learning的开源的学习工具——word2vec,这是首款面向大众的Deep Learning学习工具。word2vec(word to vector)是一个将单词转换成向量形式的工具。通过转换,把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。      word2vec为计算向量词提供了一种

2016-08-26 11:31:16 3223

原创 NLPIR/ICTCLAS 2015 分词系统使用

自然 言的处理的第一步是分词。近期使用了中科院分词系统NLPIR/ICTCLAS 2016。在2014版本以及之前称为ICTCLAS,之后的版本都更名为NLPIR。 新版简介如下:       词法分析是自然语言处理的基础与关键。 张华平博士在多年研究工作积累的基础上, 研制出了 NLPIR 分词系统, 主要功能包括中文分词; 英文分词; 词性标注; 命名实体识别;

2016-08-25 12:09:50 9787 3

转载 win 10 和 CentOS 7 双系统安装总结

工具及材料  1、一台PC  2、一个U盘,8G以上最好  3、需要的文件:CentOS7镜像文件(ISO文件)  4、需要的软件:UltraISO第一步、在Windows中为Linux分出磁盘空间  右击“此电脑” -- “管理”          若分区错误,可以右击想要合并的磁盘(比如软件D)-> "扩展卷"。第二步、制作U

2016-07-08 22:45:36 41728 7

转载 并行、并发、同步和互斥

  并行计算机操作系统中的并行,指的是同时存在于内存中的多道作业都处于运行状态。实际上都是宏观上并行,微观上串行,因为这些作业都是开始各自的运行,但都没运行完毕,只是交替地使用cpu。    在操作系统中是指,一组程序按独立异步的速度执行,不等于时间上的重叠(同一个时刻发生)。要区别并发。并发是指:在同一个时间段内,两个或

2016-06-06 16:29:33 722

转载 Java 注解

注解基础知识点-----全文转自百度百科定义:注解(Annotation),也叫元数据。一种代码级别的说明。它是JDK1.5及以后版本引入的一个特性,与类、接口、枚举是在同一个层次。它可以声明在包、类、字段、方法、局部变量、方法参数等的前面,用来对这些元素进行说明,注释。作用分类:①编写文档:通过代码里标识的元数据生成文档【生成文档doc文档】② 代码分析:通过代码里标

2016-06-06 16:20:15 472

转载 Struct和Class的区别

转载来源:http://blog.sina.com.cn/s/blog_48f587a80100k630.htmlC++中的struct对C中的struct进行了扩充,它已经不再只是一个包含不同数据类型的数据结构了,它已经获取了太多的功能。struct能包含成员函数吗? 能!struct能继承吗? 能!!struct能实现多态吗? 能!!! 既然这些它都能实现,

2016-06-02 17:56:36 356

转载 JAVA和JVM运行原理揭秘

Java语言写的源程序通过Java编译器,编译成与平台无关的‘字节码程序’(.class文件,也就是0,1二进制程序),然后在OS之上的Java解释器中解释执行,而JVM是java的核心和基础,在java编译器和os平台之间的虚拟处理器JAVA和JVM运行的原理1.Java语言运行的过程Java语言写的源程序通过Java编译器,编译成与平台无关的‘字节码程序’(.class文件

2016-06-02 17:20:53 446

转载 深入Java集合学习系列:HashMap的实现原理

1. HashMap概述:  HashMap是基于哈希表的Map接口的非同步实现(Hashtable跟HashMap很像,唯一的区别是Hashtalbe中的方法是线程安全的,也就是同步的)。此实现提供所有可选的映射操作,并允许使用null值和null键。此类不保证映射的顺序,特别是它不保证该顺序恒久不变。2. HashMap的数据结构:  在java编程语言中,最基本的结构就是两种,一

2016-05-25 13:47:39 363

转载 PageRank算法java实现版本

PageRank算法是Google的核心搜索算法,在所有链接型文档搜索中有极大用处,而且在我们的各种关联系统中都有好的用法,比如专家评分系统,微博搜索/排名,SNS系统等。   PageRank算法的依据或思想:     1,被重要的网页链接的越多(外链)  ,此网页就越重要     2,此网页对外的链接越少越重要     这两个依据不能是独立的,是需要一起考虑的。但是

2016-03-24 11:13:49 928

转载 LaTeX新人教程,30分钟从完全陌生到基本入门

1.LaTeX软件的安装和使用 方法A(自助):在MikTeX的官网下载免费的MikTeX编译包并安装。下载WinEdt(收费)或TexMaker(免费)等编辑界面软件并安装。 方法B(打包):在ctex.org下载ctex套装(含MikTeX及WinEdt) 哈哈这一部分当然不包含在标题的30分钟里。 2.第一个文档 打开WinEdt,建立一个新文档,将以下内

2016-03-21 17:06:35 2440

转载 堆排序的java实现

堆排序堆积排序(Heapsort)是指利用堆积树(堆)这种资料结构所设计的一种排序算法,可以利用数组的特点快速定位指定索引的元素。堆排序是不稳定的排序方法,辅助空间为O(1), 最坏时间复杂度为O(nlog2n) ,堆排序的堆序的平均性能较接近于最坏性能。 堆排序利用了大根堆(或小根堆)堆顶记录的关键字最大(或最小)这一特征,使得在当前无序区中选取最大(或最小)关键字的记录变得

2016-03-01 19:54:53 399

原创 JDK中 java.util.Collections类的sort方法

java.util 类 Collectionsjava.lang.Object java.util.Collectionspublic class Collectionsextends Object此类完全由在 collection 上进行操作或返回 collection 的静态方法组成。它包含在 collection 上操作的多态算法,即“包装器”,包装

2016-02-29 20:45:16 982

转载 遍历Map

遍历hashmap使用entryset快些,因大部分都是用keyset遍历的,做了对比后发现差距很大。见示例,只是简单的hashmap信息。import java.util.HashMap;import java.util.Iterator;import java.util.Calendar;public class HashMapTest {public static v

2016-02-29 20:40:44 353

转载 Java如何对Map进行排序详解

java如何对map进行排序详解(map集合的使用)这篇文章主要介绍了java如何对map进行排序,java map集合的使用详解,大家可以参考使用 一、简单介绍Map在讲解Map排序之前,我们先来稍微了解下map。map是键值对的集合接口,它的实现类主要包括:HashMap,TreeMap,Hashtable以及LinkedHashMap等。其中这四者

2016-02-29 19:31:58 1052

转载 模式匹配算法KMP

Knuth-Morris-Pratt(KMP)算法KMP算法是一种高效的前缀匹配算法,在传统蛮力(BF)匹配算法的基础上改进的地方在于每次移动的距离不是1可以是更大,没有进行回溯,BF算法的时间复杂度是O(m*n),而KMP算法的时间复杂度是O(m+n)。假设执行第i+1趟匹配时,如果比较模式串P中的第j个字符时不匹配,也就是有T[i,i+1,...,i+j-1]=P[0,1,..

2016-02-24 14:11:26 936

转载 Eclipse开发JAVA中如何Debug

Eclipse开发JAVA中如何Debugdebug就是调试java程序的方式.工具/原料Eclipse工具或MyEclipse方法/步骤1首先打开eclipse,打开java源文件 如图:2在需要测试的代码行左侧行号列上双击,生成断点 ,

2016-01-20 21:24:27 727

转载 eclipse配置环境变量

首先,为什么要设置Java环境变量?  1. PATH环境变量。作用是指定命令搜索路径,在shell下面执行命令时,它会到PATH变量所指定的路径中查找看是否能找到相应的命令程序。我们需要把 jdk安装目录下的bin目录增加到现有的PATH变量中,bin目录中包含经常要用到的可执行文件如javac/java/javadoc等待,设置好 PATH变量后,就可以在任何目录下执行javac/

2016-01-19 15:47:23 4614

转载 java中不同进制数据表现

常见不同进制的数据表现:   二进制:由0,1组成。以0b开头。   八进制:由0,1,...7组成。以0开头。   十进制:由0,1,...9组成。默认整数是十进制。   十六进制:由0,1,...9,a,b,c,d,e,f(大小写均可)组成。以0x开头。

2016-01-17 20:02:59 725

原创 java正则表达式——判断日期格式

补充一下正则表达式判断日期格式的方法:

2015-12-23 15:50:13 4842

转载 List集合以及add() 与addAll()的区别

如果有多个已经被实例化的List 集合,想要把他们组合成一个整体,并且,这里必须直接使用List 自身提供的一个方法List.addAll(),否则使用了List.add()方法,则会输出不正常的信息。     这里不能简单的使用List.add()方法,如果使用了List.add()方法,程序只能找到相应往List中添加的List 集合个数,而不会返回相应的全部结果集。    这

2015-12-22 22:11:01 1679

原创 java正则表达式——判断字符串为哪种类型的数字?

在他人博客给出的代码基础上做了相应修改后,得到以下代码段来判断字符串是否为数字,为哪一类数字。

2015-12-22 18:51:09 1654

转载 java正则表达式——验证字符串是否为数字

首先说一下java正则表达式的重点概念:第一、相关类:Pattern、Matcher第二、典型的调用顺序是 Pattern p = Pattern.compile("a*b");Matcher m = p.matcher("aaaaab");boolean b = m.matches();在仅使用一次正则表达式时,可以方便地通过此类定义 matches 方法。此方法编译表达

2015-12-21 16:43:38 9815

原创 使用Java的replace函数删除字符串中的某个字符

1.直接用空串替换所有的b:String b = "abcabcabc"; b=b.replace("b",""); 2.替换第一个b:String s = "abcabcabc";  int i=s.indexOf("b");  s=s.substring(0, i)+s.substring(i+1);  System.out.println(s);

2015-12-21 12:16:59 1649

转载 java中判断字符串是否为数字的几种方法

1.用JAVA自带的函数public static boolean isNumeric(String str){ for (int i = 0; i < str.length(); i++){ System.out.println(str.charAt(i)); if (!Character.isDigit(str.charAt(i))){ return false;

2015-12-15 21:25:04 508

原创 Java自动读取文件夹下的所有文件(包括子文件夹)

import java.util.Vector;import java.io.File;public class FileInput { public String jsonpath="D:\\"; //要读取的文件夹目录 //获取所有文件 public Vector getAllFile(String datasetpath,Vector vecFile) { File fi

2015-12-09 17:00:39 1729

原创 myeclipse生成方法注释的快捷键

注释格式如下:/**  * @param str  * @return  * @throws FileNotFoundException  * @throws IOException  */快捷键是alt+shift+j,将光标放在方法名上或选中整个方法,按快捷键。会生成上述方法注释的格式,具体内容自己填写。

2015-12-08 18:40:23 2480

原创 自己理解的Jaccard相似度算法实现

望多多指正!import java.util.List;import java.util.Iterator;public class JaccardSim { public double sim;  public JaccardSim(){   }  public double getJac(List str1,List str2){  double

2015-12-08 12:49:11 3514

转载 Edit Distance相似度算法

先给一个例子,两个字符串eeba和abca相似度是多少呢,edit distance是一个很好的度量,定义从字符串a变到字符串b,所需要的最少的操作步骤(插入,删除,更改)为两个字符串之间的编辑距离。对于eeba,abca它们之间的编辑距离为3,可以按照上面的操作步骤(不是唯一的)将eeba变到abca,1.将e变为a 2.删除e 3.添加c 共3个步骤。典型的动态规划问题。

2015-12-08 12:47:23 943

原创 Java代码包问题:

ava代码包问题:com.mongodb.DBObject和edu.cmu.graphchi.apps.randomwalks.BerkeleyManager怎样下载和导入

2015-12-08 12:43:41 433

转载 字符串相似算法-Jaro-Winkler Distance

Jaro-Winkler Distance 算法这是一种计算两个字符串之间相似度的方法,想必都听过Edit Distance,Jaro-inkler Distance 是Jaro Distance的一个扩展,而Jaro Distance(Jaro 1989;1995)据说是用来判定健康记录上两个名字是否相同,也有说是是用于人口普查,具体干什么就不管了,让我们先来看一下Jaro Distance

2015-12-08 12:41:16 2008

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除