- 博客(98)
- 资源 (2)
- 收藏
- 关注
原创 nginx+php+gitblog
Markdown 博客搭建nginx+php环境安装php 安装wget http://cn2.php.net/distributions/php-5.6.2.tar.gztar -zxvf php-5.6.2.tar.gzcd php-5.6.2./configure --prefix=/usr/local/php --with-config-file-path=/usr/local/php
2016-12-17 18:26:54 586
转载 对频率论(Frequentist)方法和贝叶斯方法(Bayesian Methods)的一个总结
注:本文是对《IPython Interactive Computing and Visualization Cookbook》一书中第七章【Introduction to statistical data analysis in Python – frequentist and Bayesian methods】的简单翻译和整理,这部分内容主要将对统计学习中的频率论方法和贝叶斯统计方法进
2015-08-14 10:19:18 1364
转载 Frequentist和Bayesian的差别
转自:http://blog.shujufan.com/2013/08/26/frequentist和bayesian的差别/ 读pattern recognition and machine learning这本书的时候,又看到了讲frequentist和bayesian的区别。对于这两者,我有一个比较模糊的概念。个人认为,最基本的差别在于对同样一堆观察数据,或者叫样本的时候,对概率的理解。前者
2015-08-02 21:27:52 7410
转载 C++利用反射和简单工厂模式实现业务模块解耦
转自:http://www.bubuko.com/infodetail-655615.html1. 业务说明为了便于说明,举一个简单的例子。假设现在有一个项目需要建立一个和银行交互的平台,目前只接入工商银行,后续接入其他银行,每个银行的业务都有差异,报文格式可能也不一致。这里只列举几个简要的流程,仅包括拼报文,发送报文,接收报文,解析报文,其余整体架构以及后续处理等
2015-06-11 20:55:41 763
原创 答辩完的随笔
昨天下午答辩完了,虽然我不把答辩特别当回事儿,但是它确实是一件事,没有处理掉总是不痛快。总算昨天下午结束了,人也轻松了。今天下午狠狠地睡了一觉,从下午1点睡到下午5点,导致现在睡不着。有一段时间没有对自己做一个总结了,趁现在睡不着,还是写点东西吧。 第一个缺点,就是总是关注于第二类事务(也就是对长期发展有利,但不紧迫的事),对于有些第一类事务(重要且紧迫)没有很用心地去处理,常常表
2015-05-15 01:46:10 551
原创 向量空间模型
向量空间模型(Vector Space Model)是一个常用的相似度计算模型,lucene排序模型中使用了向量空间模型,下面结合搜索引擎排序过程中query和文档相关性计算来说明向量空间模型。搜索引擎可以为搜索请求的query返回一大堆相关的文档(通常是关键字匹配了的文档),但是需要对这些文档按与query的相关性进行排序。对于文档d,和query q,我们需要把它们表示成方便后续计算的一个
2015-05-05 14:08:27 4163
转载 git 上传本地文件到github
http://blog.csdn.net/chaihuasong/article/details/37911723git 上传本地文件到github1 git config --global user.name "Your Real Name" 2 git config --global user.email you@email.addressgit init
2015-05-02 19:52:58 376
转载 硬中断和软中断
http://blog.csdn.net/zhangskd/article/details/21992933概述 从本质上来讲,中断是一种电信号,当设备有某种事件发生时,它就会产生中断,通过总线把电信号发送给中断控制器。如果中断的线是激活的,中断控制器就把电信号发送给处理器的某个特定引脚。处理器于是立即停止自己正在做的事,跳到中断处理程序的入口点,进行中断处
2015-04-18 21:01:51 719
原创 Java NIO 总结
从不同的抽象层次来看I/O操作,所得到的API是不同的,最早的java.io包把I/O操作抽象成数据的流动,进而有了流(stream)的概念。在Java NIO中,则把I/O操作抽象成端到端的一个数据连接,这就有了通道(channel)的概念。一、Java NIO与IO的主要区别1. IO是面向流的,而NIO是面向缓冲java I/O面向流意味着每次从流中读取一个字节或多个字节,直到读
2015-04-16 14:39:37 571
原创 Java 代理模式
最近在读《Hadoop技术内幕》,读到 hadoop远程过程调用这一章时很吃力,原因是对java 动态代理、java Nio、java多线程理解的不是很透彻。因此先专门花点时间把这一部分恶补一下。 Java 代理模式分为远程代理、虚拟代理和动态代理,下面分别将这几个代理模式。 远程代理 远程代理就好比“远程对象的本地代表”。何谓“远程对象”?这是一种对象,活在不同的J
2015-04-13 19:40:30 495
原创 hadoop实现原理 (二)序列化
序列化有三种主要的用途: (1) 作为一种持久化格式:一个对象被序列化以后,它的编码可以被存储到磁盘上,供以后反序列化用; (2) 作为一种通信数据格式:序列化结果可以从一个正在运行的虚拟机,通过网络被传递到另一个虚拟机上; (3) 作为一种拷贝、克隆机制:将对象序列化到内存的缓冲区中,然后通过反序列化,可以得到一个对已存对象进行深拷贝的新对象。 在分布式数据处理中,主要使用前面两种。 J
2015-04-06 22:40:11 633
原创 hadoop实现原理(一)配置信息处理
Hadoop作为一个复杂的软件系统,使用一个配置模块提高其适应性或扩展性,作为其扩展、定制的手段和方式。 为什么不直接使用java.util.Properties类? Properties类继承自Hashtable,它并不能支持INI文件的“节”,对配置项进行分类。Properties类提供了load()方法加载,该方法从输入流中读入key-value对,而store()方法则将Properti
2015-04-04 20:47:26 632
原创 maven如何将项目引用的所有jar包复制到lib文件夹内
Maven的非web项目在执行时需要引用很多jar包,这时候通常的做法是将这些jar包统一放到lib目录中,maven的dependency插件可以帮我们做这件事情。我们需要在pom文件的build节点的plugins节点内添加一个plugin,plugin内容如下: <plugin> <groupId>org.apache.maven.plugins</groupId>
2015-04-01 17:06:34 957
原创 maven中如何将所有引用的jar包打包到一个jar中
java的jar包太多了,有时候我们为了方便执行,希望把所有引用的jar包打包到一起。maven可以做到吗?肯定是可以的,需要使用maven-assembly-plugin这个maven插件,使用方法说明如下:首先在pom文件的build节点中添加这个插件的引用:<build><plugins><plugin> <artifactId>maven-assembly-plugin</artif
2015-04-01 17:06:10 1013
原创 添加本地的Jar文件到Maven库
mvn install:install-file -Dfile= -DgroupId= -DartifactId= -Dversion= -Dpackaging= -DgeneratePom=trueWhere: jar文件所存放的地址 jar文件所属的group jar的artifact名称,一般就是去掉后缀的文件名 此jar文件的版本
2015-04-01 17:02:30 443
转载 Spark快速入门之单机模式Java应用程序开发
http://blog.sina.com.cn/s/blog_59c29ded0102v4i7.html本文旨在记录初学Spark时,根据官网快速入门中的一段Java代码,在Maven上建立应用程序并实现执行。1.开发软件 1) JDK 版本:1.7 2) Maven 版本:3.2.3 : http://maven
2015-03-29 15:21:55 1904
转载 Best data structure for dictionary implementation
http://stackoverflow.com/questions/10017808/best-data-structure-for-dictionary-implementationDepending on what you want to do, there are many good data structures.If you just want to store the words an
2015-03-11 15:15:16 543
转载 [转自知乎]总有些人,让你找不到话题可聊
http://zhuanlan.zhihu.com/lswlsw/19886673我督导的一位咨询师,在一次督导中表现得心神不宁。他问我:如果来访者已经到了诊室,却说「这周,所有问题都已经解决了」,那应该怎么办?是那个来访者吗?我问。他点头。我说:那很好啊。如果他说的是真的,说明你的工作有成效了。「我知道,是,我知道,」他犹豫不决地说,「可是……」关于那个来访者,是一个失恋的男性大学生,因为接连的恋
2015-03-07 17:04:36 1186
原创 2015计划
这个学期是研究生三年的最后一个学期,研究生这几年收获太少了,最后一个学期要好好把握,算是亡羊补牢吧。这个学期的首要任务是把毕业论文写完,顺利地通过答辩。论文上个学期已经把主体部分写的差不多了,现在需要做的工作是排序算法部分,主要是实验评估上,最好加上实验的多个角度评估,还有就是前面相关技术部分的字要码进去。这是最终要的一件事。论文要尽早搞定,4月1号之前一定要搞定。第二就是自己要做一些跟将来工作相关
2015-03-02 10:26:35 493
原创 敬畏
很早就想对自己的2014年做一个总结,但一直拖到现在。因为发现要总结的事有太多,不知道该怎么组织自己的语言,所以迟迟没有开始写。但一直也懒得去思考怎么总结,所以就一直没有写。今天实在闲得烦躁,而且这些天没有一个很好的计划,所以做事情的效率不高,带着反思和期许的心情开始边想边总结。2014年不太顺利,有些折腾,发现了自身的很多缺点,而自己也不但的在思考,虽然暂时没有很多的提高,但是至少找到了问题所在
2015-03-01 23:03:36 490
转载 memcache的一致性hash算法使用
转载自:http://blog.csdn.net/woshiwu/article/details/6528706一、概述 1、我们的memcache客户端(这里我看的spymemcache的源码),使用了一致性hash算法ketama进行数据存储节点的选择。与常规的hash算法思路不同,只是对我们要存储数据的key进行hash计算,分配到不同节点存储。一致性hash算法是对我
2015-02-28 12:21:36 427
原创 hadoop 学习笔记(二)MapReduce的工作机制
图1 Hadoop运行MapReduce作业的工作原理作业的提交JobClient的runJob()方法是用于新建JobClient实例并调用其submitJob()方法的便捷方式(步骤1)。提交作业后,runJob()每秒轮询作业的进度,如果发现上次报告后有改变,便把进度报告到控制台。作业完成后,如果成功,就显示作业计数器。如果失败,导致作业失败的错误被记录到控制台。JobC
2015-01-29 15:33:49 623
原创 hadoop 学习笔记(一)hadoop 数据流
文件读取解析为了了解客户端及与之交互的HDFS、namenode和datanode之间的数据流是什么样的,我们可以参考图1,该图显示了在读取文件时一些事件的主要顺序。 图1 客户端读取HDFS中的数据
2015-01-28 14:27:31 1022
转载 JSP和Servlet的中文乱码处理
http://blog.csdn.net/longyuhome/article/details/7856270JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题,写成了博客,今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学,所以有不足之处希望谅解。一、表单提交时出现乱码:
2015-01-06 10:18:29 433
原创 [C++读书笔记] 成员初始化列表
在下列情况下,为了让你的程序能够被顺利编译,你必须使用成员初始化列表:1. 当初始化一个reference member 时;2. 当初始化一个const member时;3. 当调用一个base class 的constructor, 而它拥有一组参数时;4. 当调用一个member class的constructor, 而它拥有一组参数时。在这4种情况下,程序可以被正确编译
2014-12-31 20:11:24 444
转载 Apache SolrCloud安装
http://blog.javachen.com/2014/03/10/how-to-install-solrcloud/Apache SolrCloud安装2014.03.10SolrCloud 通过 ZooKeeper 集群来进行协调,使一个索引进行分片,各个分片可以分布在不同的物理节点上,多个物理分片组成一个完成的索引 Collection。SolrCloud 自动支
2014-12-30 20:42:06 590
原创 Nutch + Solr + Hadoop 搭建分布式搜索引擎详细教程
Nutch + Solr + Hadoop 搭建分布式搜索引擎详细文档经过几天的摸索,终于完全成功地把环境搭建好了,这个过程遇到各种问题,并且目前网上没有一个完全可行的详细环境搭建教程,所以这里专门写一个详细的文档作为记录,这里主要记录nutch 的配置。环境:Linux 3.14.2 x86_64, JDK 1.7.0.51 x86_64准备: hadoop 2.4.1 ,
2014-12-27 16:26:29 2980
转载 卸载和安装LINUX上的JDK
卸载和安装LINUX上的JDK 卸载默认的:用root用户登陆到系统,打开一个终端输入# rpm -qa|grep gcj显示内容其中包含下面两行信息# java-1.4.2-gcj-compat-1.4.2.0-27jpp# java-1.4.2-gcj-compat-devel-l.4.2.0-27jpp卸载# rpm -e java
2014-12-25 22:10:35 424
原创 [leetcode] Median of Two Sorted Arrays
There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).Given a sorted array A of len
2014-12-11 22:25:39 456
转载 [CLRS] Problems 16-1: Coin changing
link http://ripcrixalis.blog.com/2011/02/08/clrs-chapter-16/Problems 16-1: Coin changingConsider the problem of making change for n cents using the fewest number of coins. Assume that each c
2014-12-10 11:13:24 3513
原创 [DP] 0-1 Knapsack Problem
Given weights and values of n items, put these items in a knapsack of capacity W to get the maximum total value in the knapsack. In other words, given two integer arrays val[0..n-1] and wt[0..n-1] whi
2014-12-03 17:54:20 688
原创 [DP]Min Cost Path
Given a cost matrix cost[][] and a position (m, n) in cost[][], write a function that returns cost of minimum cost path to reach (m, n) from (0, 0). Each cell of the matrix represents a cost to traver
2014-12-01 16:15:46 478
原创 最短编辑距离
https://web.stanford.edu/class/cs124/lec/med.pdf#include #include int min(int a,int b){ return a<=b ? a:b;}// X and Y index from 1int ed(char X[] ,int m, char Y[], int n){ int **dp = new
2014-12-01 15:04:22 388
原创 [DP]Longest Common Subsequence
LCS Problem Statement: Given two sequences, find the length of longest subsequence present in both of them. A subsequence is a sequence that appears in the same relative order, but not necessarily con
2014-12-01 12:59:54 534
原创 最长上升子序列nlogn算法
定义d[k]:长度为k的上升子序列的最末元素,若有多个长度为k的上升子序列,则记录最小的那个最末元素。注意d中元素是单调递增的,下面要用到这个性质。首先len = 1,d[1] = a[1],然后对a[i]:若a[i]>d[len],那么len++,d[len] = a[i];否则,我们要从d[1]到d[len-1]中找到一个j,满足d[j-1]最终答案就是len利用d的单调性
2014-12-01 12:41:19 471
原创 [DP]Longest Increasing Subsequence
The longest Increasing Subsequence (LIS) problem is to find the length of the longest subsequence of a given sequence such that all elements of the subsequence are sorted in increasing order. For ex
2014-12-01 09:45:50 481
原创 桶中取黑白球问题
有一个桶,里面有白球、黑球各100个,人们必须按照以下规则把球取出来:每次从桶里面拿两个球如果是两个同色的球,就再放入一个黑球;如果是两个异色的球,就再放入一个白球。问题是:最后桶里面只剩下一个黑球的概率是多少?针对这样一个问题,我们有两种不一样的解法:方法一:首先,我们可以通过相应的数学式来建立与上述三个条件等同的表达方式。在这里,我们
2014-10-17 21:00:50 940
原创 概率面试
1、给你一个数组,设计一个既高效又公平的方法随机打乱这个数组(此题和洗牌算法的思想一致) 方法比较简单,基本思想是每次随机取一个数,然后把它交换到最后的位置。然后对前(n-1)个数使用递归的算法。 递归实现: 123456void suffle(int a[],int n){
2014-10-12 22:53:45 710
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人