自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

厚积薄发

keep coding, keep reading, keep thinking

  • 博客(98)
  • 资源 (2)
  • 收藏
  • 关注

原创 nginx+php+gitblog

Markdown 博客搭建nginx+php环境安装php 安装wget http://cn2.php.net/distributions/php-5.6.2.tar.gztar -zxvf php-5.6.2.tar.gzcd php-5.6.2./configure --prefix=/usr/local/php --with-config-file-path=/usr/local/php

2016-12-17 18:26:54 585

转载 对频率论(Frequentist)方法和贝叶斯方法(Bayesian Methods)的一个总结

注:本文是对《IPython Interactive Computing and Visualization Cookbook》一书中第七章【Introduction to statistical data analysis in Python – frequentist and Bayesian methods】的简单翻译和整理,这部分内容主要将对统计学习中的频率论方法和贝叶斯统计方法进

2015-08-14 10:19:18 1360

转载 Frequentist和Bayesian的差别

转自:http://blog.shujufan.com/2013/08/26/frequentist和bayesian的差别/ 读pattern recognition and machine learning这本书的时候,又看到了讲frequentist和bayesian的区别。对于这两者,我有一个比较模糊的概念。个人认为,最基本的差别在于对同样一堆观察数据,或者叫样本的时候,对概率的理解。前者

2015-08-02 21:27:52 7400

转载 C++利用反射和简单工厂模式实现业务模块解耦

转自:http://www.bubuko.com/infodetail-655615.html1. 业务说明为了便于说明,举一个简单的例子。假设现在有一个项目需要建立一个和银行交互的平台,目前只接入工商银行,后续接入其他银行,每个银行的业务都有差异,报文格式可能也不一致。这里只列举几个简要的流程,仅包括拼报文,发送报文,接收报文,解析报文,其余整体架构以及后续处理等

2015-06-11 20:55:41 762

原创 hadoop实现原理 (三) 远程过程调用

分析hadoop源码,梳理远程过程调用的原理

2015-05-18 20:17:15 664

原创 答辩完的随笔

昨天下午答辩完了,虽然我不把答辩特别当回事儿,但是它确实是一件事,没有处理掉总是不痛快。总算昨天下午结束了,人也轻松了。今天下午狠狠地睡了一觉,从下午1点睡到下午5点,导致现在睡不着。有一段时间没有对自己做一个总结了,趁现在睡不着,还是写点东西吧。       第一个缺点,就是总是关注于第二类事务(也就是对长期发展有利,但不紧迫的事),对于有些第一类事务(重要且紧迫)没有很用心地去处理,常常表

2015-05-15 01:46:10 551

原创 向量空间模型

向量空间模型(Vector Space Model)是一个常用的相似度计算模型,lucene排序模型中使用了向量空间模型,下面结合搜索引擎排序过程中query和文档相关性计算来说明向量空间模型。搜索引擎可以为搜索请求的query返回一大堆相关的文档(通常是关键字匹配了的文档),但是需要对这些文档按与query的相关性进行排序。对于文档d,和query q,我们需要把它们表示成方便后续计算的一个

2015-05-05 14:08:27 4160

转载 git 上传本地文件到github

http://blog.csdn.net/chaihuasong/article/details/37911723git 上传本地文件到github1 git config --global user.name "Your Real Name" 2 git config --global user.email you@email.addressgit init

2015-05-02 19:52:58 376

转载 硬中断和软中断

http://blog.csdn.net/zhangskd/article/details/21992933概述 从本质上来讲,中断是一种电信号,当设备有某种事件发生时,它就会产生中断,通过总线把电信号发送给中断控制器。如果中断的线是激活的,中断控制器就把电信号发送给处理器的某个特定引脚。处理器于是立即停止自己正在做的事,跳到中断处理程序的入口点,进行中断处

2015-04-18 21:01:51 714

原创 Java NIO 总结

从不同的抽象层次来看I/O操作,所得到的API是不同的,最早的java.io包把I/O操作抽象成数据的流动,进而有了流(stream)的概念。在Java NIO中,则把I/O操作抽象成端到端的一个数据连接,这就有了通道(channel)的概念。一、Java NIO与IO的主要区别1. IO是面向流的,而NIO是面向缓冲java I/O面向流意味着每次从流中读取一个字节或多个字节,直到读

2015-04-16 14:39:37 569

原创 Java 代理模式

最近在读《Hadoop技术内幕》,读到 hadoop远程过程调用这一章时很吃力,原因是对java 动态代理、java Nio、java多线程理解的不是很透彻。因此先专门花点时间把这一部分恶补一下。    Java 代理模式分为远程代理、虚拟代理和动态代理,下面分别将这几个代理模式。    远程代理    远程代理就好比“远程对象的本地代表”。何谓“远程对象”?这是一种对象,活在不同的J

2015-04-13 19:40:30 495

原创 hadoop实现原理 (二)序列化

序列化有三种主要的用途: (1) 作为一种持久化格式:一个对象被序列化以后,它的编码可以被存储到磁盘上,供以后反序列化用; (2) 作为一种通信数据格式:序列化结果可以从一个正在运行的虚拟机,通过网络被传递到另一个虚拟机上; (3) 作为一种拷贝、克隆机制:将对象序列化到内存的缓冲区中,然后通过反序列化,可以得到一个对已存对象进行深拷贝的新对象。 在分布式数据处理中,主要使用前面两种。 J

2015-04-06 22:40:11 632

原创 hadoop实现原理(一)配置信息处理

Hadoop作为一个复杂的软件系统,使用一个配置模块提高其适应性或扩展性,作为其扩展、定制的手段和方式。 为什么不直接使用java.util.Properties类? Properties类继承自Hashtable,它并不能支持INI文件的“节”,对配置项进行分类。Properties类提供了load()方法加载,该方法从输入流中读入key-value对,而store()方法则将Properti

2015-04-04 20:47:26 627

原创 maven如何将项目引用的所有jar包复制到lib文件夹内

Maven的非web项目在执行时需要引用很多jar包,这时候通常的做法是将这些jar包统一放到lib目录中,maven的dependency插件可以帮我们做这件事情。我们需要在pom文件的build节点的plugins节点内添加一个plugin,plugin内容如下: <plugin>            <groupId>org.apache.maven.plugins</groupId>

2015-04-01 17:06:34 954

原创 maven中如何将所有引用的jar包打包到一个jar中

java的jar包太多了,有时候我们为了方便执行,希望把所有引用的jar包打包到一起。maven可以做到吗?肯定是可以的,需要使用maven-assembly-plugin这个maven插件,使用方法说明如下:首先在pom文件的build节点中添加这个插件的引用:<build><plugins><plugin>  <artifactId>maven-assembly-plugin</artif

2015-04-01 17:06:10 1010

原创 添加本地的Jar文件到Maven库

mvn install:install-file -Dfile= -DgroupId= -DartifactId= -Dversion= -Dpackaging= -DgeneratePom=trueWhere: jar文件所存放的地址 jar文件所属的group jar的artifact名称,一般就是去掉后缀的文件名 此jar文件的版本

2015-04-01 17:02:30 443

转载 Spark快速入门之单机模式Java应用程序开发

http://blog.sina.com.cn/s/blog_59c29ded0102v4i7.html本文旨在记录初学Spark时,根据官网快速入门中的一段Java代码,在Maven上建立应用程序并实现执行。1.开发软件 1) JDK 版本:1.7 2) Maven 版本:3.2.3 : http://maven

2015-03-29 15:21:55 1902

转载 Best data structure for dictionary implementation

http://stackoverflow.com/questions/10017808/best-data-structure-for-dictionary-implementationDepending on what you want to do, there are many good data structures.If you just want to store the words an

2015-03-11 15:15:16 543

转载 [转自知乎]总有些人,让你找不到话题可聊

http://zhuanlan.zhihu.com/lswlsw/19886673我督导的一位咨询师,在一次督导中表现得心神不宁。他问我:如果来访者已经到了诊室,却说「这周,所有问题都已经解决了」,那应该怎么办?是那个来访者吗?我问。他点头。我说:那很好啊。如果他说的是真的,说明你的工作有成效了。「我知道,是,我知道,」他犹豫不决地说,「可是……」关于那个来访者,是一个失恋的男性大学生,因为接连的恋

2015-03-07 17:04:36 1186

原创 2015计划

这个学期是研究生三年的最后一个学期,研究生这几年收获太少了,最后一个学期要好好把握,算是亡羊补牢吧。这个学期的首要任务是把毕业论文写完,顺利地通过答辩。论文上个学期已经把主体部分写的差不多了,现在需要做的工作是排序算法部分,主要是实验评估上,最好加上实验的多个角度评估,还有就是前面相关技术部分的字要码进去。这是最终要的一件事。论文要尽早搞定,4月1号之前一定要搞定。第二就是自己要做一些跟将来工作相关

2015-03-02 10:26:35 493

原创 敬畏

很早就想对自己的2014年做一个总结,但一直拖到现在。因为发现要总结的事有太多,不知道该怎么组织自己的语言,所以迟迟没有开始写。但一直也懒得去思考怎么总结,所以就一直没有写。今天实在闲得烦躁,而且这些天没有一个很好的计划,所以做事情的效率不高,带着反思和期许的心情开始边想边总结。2014年不太顺利,有些折腾,发现了自身的很多缺点,而自己也不但的在思考,虽然暂时没有很多的提高,但是至少找到了问题所在

2015-03-01 23:03:36 490

转载 memcache的一致性hash算法使用

转载自:http://blog.csdn.net/woshiwu/article/details/6528706一、概述  1、我们的memcache客户端(这里我看的spymemcache的源码),使用了一致性hash算法ketama进行数据存储节点的选择。与常规的hash算法思路不同,只是对我们要存储数据的key进行hash计算,分配到不同节点存储。一致性hash算法是对我

2015-02-28 12:21:36 427

原创 hadoop 学习笔记(二)MapReduce的工作机制

图1 Hadoop运行MapReduce作业的工作原理作业的提交JobClient的runJob()方法是用于新建JobClient实例并调用其submitJob()方法的便捷方式(步骤1)。提交作业后,runJob()每秒轮询作业的进度,如果发现上次报告后有改变,便把进度报告到控制台。作业完成后,如果成功,就显示作业计数器。如果失败,导致作业失败的错误被记录到控制台。JobC

2015-01-29 15:33:49 617

原创 hadoop 学习笔记(一)hadoop 数据流

文件读取解析为了了解客户端及与之交互的HDFS、namenode和datanode之间的数据流是什么样的,我们可以参考图1,该图显示了在读取文件时一些事件的主要顺序。                                                          图1 客户端读取HDFS中的数据

2015-01-28 14:27:31 1021

转载 JSP和Servlet的中文乱码处理

http://blog.csdn.net/longyuhome/article/details/7856270JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题,写成了博客,今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学,所以有不足之处希望谅解。一、表单提交时出现乱码:

2015-01-06 10:18:29 433

原创 [C++读书笔记] 成员初始化列表

在下列情况下,为了让你的程序能够被顺利编译,你必须使用成员初始化列表:1. 当初始化一个reference member 时;2. 当初始化一个const member时;3. 当调用一个base class 的constructor, 而它拥有一组参数时;4. 当调用一个member class的constructor, 而它拥有一组参数时。在这4种情况下,程序可以被正确编译

2014-12-31 20:11:24 444

转载 Apache SolrCloud安装

http://blog.javachen.com/2014/03/10/how-to-install-solrcloud/Apache SolrCloud安装2014.03.10SolrCloud 通过 ZooKeeper 集群来进行协调,使一个索引进行分片,各个分片可以分布在不同的物理节点上,多个物理分片组成一个完成的索引 Collection。SolrCloud 自动支

2014-12-30 20:42:06 590

原创 Nutch + Solr + Hadoop 搭建分布式搜索引擎详细教程

Nutch + Solr + Hadoop 搭建分布式搜索引擎详细文档经过几天的摸索,终于完全成功地把环境搭建好了,这个过程遇到各种问题,并且目前网上没有一个完全可行的详细环境搭建教程,所以这里专门写一个详细的文档作为记录,这里主要记录nutch 的配置。环境:Linux 3.14.2 x86_64, JDK 1.7.0.51 x86_64准备:  hadoop 2.4.1 ,

2014-12-27 16:26:29 2977

转载 卸载和安装LINUX上的JDK

卸载和安装LINUX上的JDK 卸载默认的:用root用户登陆到系统,打开一个终端输入# rpm -qa|grep gcj显示内容其中包含下面两行信息# java-1.4.2-gcj-compat-1.4.2.0-27jpp# java-1.4.2-gcj-compat-devel-l.4.2.0-27jpp卸载# rpm -e java

2014-12-25 22:10:35 424

原创 [leetcode] Median of Two Sorted Arrays

There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).Given a sorted array A of len

2014-12-11 22:25:39 456

转载 [CLRS] Problems 16-1: Coin changing

link http://ripcrixalis.blog.com/2011/02/08/clrs-chapter-16/Problems 16-1: Coin changingConsider the problem of making change for n cents using the fewest number of coins. Assume that each c

2014-12-10 11:13:24 3507

原创 [DP] 0-1 Knapsack Problem

Given weights and values of n items, put these items in a knapsack of capacity W to get the maximum total value in the knapsack. In other words, given two integer arrays val[0..n-1] and wt[0..n-1] whi

2014-12-03 17:54:20 686

原创 [DP]Min Cost Path

Given a cost matrix cost[][] and a position (m, n) in cost[][], write a function that returns cost of minimum cost path to reach (m, n) from (0, 0). Each cell of the matrix represents a cost to traver

2014-12-01 16:15:46 477

原创 最短编辑距离

https://web.stanford.edu/class/cs124/lec/med.pdf#include #include int min(int a,int b){ return a<=b ? a:b;}// X and Y index from 1int ed(char X[] ,int m, char Y[], int n){ int **dp = new

2014-12-01 15:04:22 388

原创 [DP]Longest Common Subsequence

LCS Problem Statement: Given two sequences, find the length of longest subsequence present in both of them. A subsequence is a sequence that appears in the same relative order, but not necessarily con

2014-12-01 12:59:54 533

原创 最长上升子序列nlogn算法

定义d[k]:长度为k的上升子序列的最末元素,若有多个长度为k的上升子序列,则记录最小的那个最末元素。注意d中元素是单调递增的,下面要用到这个性质。首先len = 1,d[1] = a[1],然后对a[i]:若a[i]>d[len],那么len++,d[len] = a[i];否则,我们要从d[1]到d[len-1]中找到一个j,满足d[j-1]最终答案就是len利用d的单调性

2014-12-01 12:41:19 470

原创 [DP]Longest Increasing Subsequence

The longest Increasing Subsequence (LIS) problem is to find the length of the longest subsequence of a given sequence such that all elements of the subsequence are sorted in increasing order. For ex

2014-12-01 09:45:50 480

原创 桶中取黑白球问题

有一个桶,里面有白球、黑球各100个,人们必须按照以下规则把球取出来:每次从桶里面拿两个球如果是两个同色的球,就再放入一个黑球;如果是两个异色的球,就再放入一个白球。问题是:最后桶里面只剩下一个黑球的概率是多少?针对这样一个问题,我们有两种不一样的解法:方法一:首先,我们可以通过相应的数学式来建立与上述三个条件等同的表达方式。在这里,我们

2014-10-17 21:00:50 940

原创 概率面试

1、给你一个数组,设计一个既高效又公平的方法随机打乱这个数组(此题和洗牌算法的思想一致)  方法比较简单,基本思想是每次随机取一个数,然后把它交换到最后的位置。然后对前(n-1)个数使用递归的算法。  递归实现: 123456void suffle(int a[],int n){

2014-10-12 22:53:45 707

原创 美团面试总结

美团一直是我非常向往的公司。一面:

2014-10-12 22:16:00 563

Unix 环境高级编程第二版

Unix 环境高级编程,程序员进阶的宝典,讲了各种Unix 系统级原理及编程

2014-12-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除