自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(64)
  • 资源 (8)
  • 收藏
  • 关注

转载 什么是凸优化问题

https://zh.wikipedia.org/wiki/%E5%87%B8%E5%87%BD%E6%95%B0数学中最优化问题的一般表述是求取,使,其中是n维向量,是的可行域,是上的实值函数。凸优化问题是指是闭合的凸集合且是上的凸函数的最优化问题,这两个条件任一不满足则该问题即为非凸的最优化问题。其中,是凸集是指对集合中的任意两点,有,即任意两点的连

2015-10-21 17:09:45 3805

翻译 信号与槽的原理

信号与槽的原理http://doc.qt.io/qt-4.8/signalsandslots.html信号与槽机制(signal and slots)1. 当一个特定事件发生时,QT的对象发出一个信号(signal)。2. 槽(slot)就是一个C++函数,被定义来对特定信号进行功能响应。-------------------------

2015-10-19 21:07:11 1450

转载 Dahua Lin recommended math book

1. 线性代数 (Linear Algebra):我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年级的时候就学习了这门课,后来到了香港后,又重新把线性代数读了一遍,所读的是Introduction to Linear Algebra (3rd Ed.)  by Gilbert Stra

2014-11-19 21:34:11 1288

转载 概率模型与计算机视觉

“概率模型与计算机视觉”林达华美国麻省理工学院(MIT)博士上世纪60年代, Marvin Minsky 在MIT让他的本科学生 Gerald Jay Sussman用一个暑假的时间完成一个有趣的Project: “link a camera to a computer and get the computer to describe what it saw”。从那时开

2014-11-19 21:17:18 745

转载 CNN相关资料

http://www.cnblogs.com/tornadomeet/archive/2013/05/05/3061457.html

2014-07-26 20:32:59 500

转载 CPP Summary

【C++ FAQ]http://www.parashift.com/c++-faq/mentoring.html

2014-06-13 09:39:15 539

转载 Interview Summary

http://www.dreambigcareer.com/#!Amazon-eBay-Facebook-Google-LinkedIn-/c19re/060EF7D6-F699-4BE0-A3B8-2B403ED95CBF

2014-06-11 09:26:31 526

转载 JDK1.5 泛型

http://blog.csdn.net/turkeyzhou/article/details/2888774

2014-06-03 01:00:18 550

转载 JAVA 抽象类和接口

http://blog.csdn.net/chenssy/article/details/12858267

2014-06-02 22:54:19 492

转载 Spark分析

http://www.csdn.net/article/2014-05-29/2820013

2014-05-30 08:59:57 679

原创 Realtime Data Processing

http://highlyscalable.wordpress.com/2013/08/20/in-stream-big-data-processing/

2014-05-29 10:50:08 726

原创 MOOC Collection

[Data Structure]http://mooc.guokr.com/course/606/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%EF%BC%88%E4%B8%8A%EF%BC%89/

2014-05-28 12:09:13 464

原创 Big Data Science Collection

http://www.52ml.net/categories/machinelearning

2014-05-28 12:07:52 846

转载 CPP STL

http://www.cs.wustl.edu/~schmidt/PDF/stl4.pdf

2014-05-18 01:43:12 721

转载 deep learning reading list

http://www.idsia.ch/~juergen/DeepLearning15May2014.pdf

2014-05-17 11:32:50 471

转载 google page rank 解释

http://www.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture3/lecture3.html

2014-05-17 11:30:53 499

原创 summary of big data science terms

SGD: stochastic gradient descent

2014-05-14 12:36:10 609

转载 Improving Word Representations via Global Context and MultipleWord Prototypes

Andrew Y. Ng 他们在"Improving Word Representations via Global Context and MultipleWord Prototypes"训练词向量时添加了全局信息并处理了多义词。通过文档里所有词向量的加权和表示文档,通过词所在的环境对多义词进行区分和重表示。文中的提到的训练技巧:使用mini-batch L-BFGS 效果优于SGD。

2014-05-14 12:30:23 742

转载 surveys on big data science

http://www.mlsurveys.com/

2014-05-14 12:26:40 555

转载 如何成为一名数据科学家?

"Data Science = statistics who uses python and lives in San Francisco"恰好我马上启程到Twitter的data science team,而且恰巧懂一点点统计和住在旧金山,所以冲动地没有邀请就厚脸回答了:D我认为有几个大方面1)学好python。现在几乎所以公司的数据都可以api给你,而python的

2014-05-14 12:07:49 533

转载 看懂信息检索和网络数据挖掘领域论文的必备知识总结

信息检索和网络数据领域(WWW, SIGIR, CIKM, WSDM, ACL, EMNLP等)的论文中常用的模型和技术总结引子:对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。

2013-02-27 20:59:16 309

转载 智力型程序题

下面是一个C程序,其想要输出20个减号,不过,粗心的程序员把代码写错了,你需要把下面的代码修改正确,不过,你只能增加或是修改其中的一个字符,请你给出三种答案。 int n=20; for(int i=0; i    printf("-"); } 解1:int n=20; for(int i=0; -i{     printf("-");

2012-03-15 18:44:09 742

转载 微软面试题:站在地球上的某一点,向南走一公里,然后向东走一公里,最后向北走一公里,回到了原点。地球上有多少个满足这样条件的点?

微软面试题:站在地球上的某一点,向南走一公里,然后向东走一公里,最后向北走一公里,回到了原点。地球上有多少个满足这样条件的点?分析:这是一道智力题。从逻辑上来讲,题目从好像缺少了一次向西的过程,才可以回到原地。有没有可能向东1公里还在原地,答案是肯定的,如果有一个纬度,绕其一圈恰好是1公里即可实现,所以这样的点有无穷多个,只要找到那个纬度即可。评论部分指出遗漏了

2012-03-15 17:46:33 13979 1

转载 两根导火索

问题:给你提供两根导火索。燃完一根正好历时1分钟,但是因材料不均匀,分段燃点时,时间与长度不成正比。你能否利用它们来准确定出45秒的时间解答:同时点燃绳子A的两端,和绳子B的 一端,当A烧完时,B余下的可以烧半个小时 。这时把B的另一端点燃,等B烧完后时间就是45分钟

2012-03-15 17:41:47 958

转载 谷歌面试题之一 8个球的称重问题 答案

谷歌面试题之一:有八个大小相同的球,其中7个重量相等,有一个稍微重一点。如何用天平仅称两次就能确定哪个球更重?答案:第一次随便拿出其中的6个,放在天平上左右各3个称重,就可以确定较重的一个在哪里了,有三种情况:在天平左边3个中,在天平右边的3个中,或者是在剩下的2个中。第二次就很好找到比较重的一个了,假如是前两种情况,只要随便拿出来3个中的2个,放在天平上称一下就知道了:如果不一样重,

2012-03-15 17:38:58 2187

翻译 面试题(1)

t func(x) { int countx = 0; while (x) { countx ++; x = x&(x -1); } return countx; }假设x = 9999, 请问返回值为多少?======================================

2012-02-29 01:27:29 343

翻译 STL相关知识点(2)

typename 的两种用法用法一:注意,如果要把一个template中的某个表示符号指定为一种类型,就算意图显而易见,关键字typename也不可或缺,因此C++的一般规则是,除了以typename修饰之外,template内的任何标记符号都被视为一个值(value)而非一个型别。用法二:typename可以在template声明中用来替换

2012-02-27 18:23:42 281

翻译 STL相关知识点(1)

1、类别(type)可作为template参数,非类别(nontype)也可以作为template参数。2、允许缺省模板参数template >template Myclass;如果只传递给他一个参数,那么缺省参数可以作为第二参数使用:Myclass x1;Myclass > 上面两种方式等价。注意:template缺省

2012-02-27 18:08:23 334

转载 Hadoop-0.20.0源代码分析(11)

这里分析一下IPC模型中的Server端的实现。该Server类的实现有点复杂,而且涉及到网络中字节流缓冲区的操作问题,及其字节数据的反序列化。Server类该Server是服务端的抽象实现,定义了一个抽象的IPC服务。 该IPC服务器接收Client发送的参数值,并返回响应值。同时,作为IPC模型的服务端,它要维护Client端到Server端的一组连接。首先看Serve

2012-02-21 22:32:09 495

转载 Hadoop-0.20.0源代码分析(10)

DFSClient是分布式文件系统客户端,它能够连接到Hadoop文件系统执行指定任务,那么它要与Namenode与Datanode基于一定的协议来进行通信。这个通信过程中,涉及到不同进程之间的通信。在org.apache.hadoop.ipc包中,定义了进程间通信的Client端与Server端的抽象,也就是基于C/S模式进行通信。这里先对org.apache.hadoop.ipc包中有关类的源

2012-02-21 22:31:31 491

转载 Hadoop-0.20.0源代码分析(09)

通过前面,对Hadoop的org.apache.hadoop.fs包中内容进行分析,已经基本了解到,一个文件系统应该具备哪些基本要素和基本操作。最显著的一个特点就是,FileSystem文件系统是基于流式数据访问的,并且,可以基于命令行的方式来对文件系统的文件进行管理与操作。而且,基于FileSystem文件系统的抽象定义,我们可以了解到,继承自该抽象的一切具体实现的文件系统,都具有统一的文件访问

2012-02-21 22:31:00 386

转载 Hadoop-0.20.0源代码分析(08)

这里,继续对FsShell类中一些命令进行阅读分析,主要是看与拷贝文件有关的几个命令。cp命令该命令实现对文件的拷贝操作,并且支持在不同的文件系统之间进行文件的拷贝。拷贝文件涉及的操作比较复杂,核心拷贝操作还是调用了org.apache.hadoop.fs.FileUtil类的copy方法实现的。 先看该类中定义的其中一个copy方法的实现:[java] v

2012-02-21 22:30:35 539

转载 Hadoop-0.20.0源代码分析(07)

前面分析了与操作系统有关的Shell命令,它们用于与操作系统进行命令行方式的交互。在Hadoop中,自定义了FileSystem文件系统,这是基于Unix操作系统之上的文件系统,为了方便对FileSystem的管理,通过org.apache.hadoop.fs.FsShell类定义了对Hadoop FileSystem文件系统进行命令行方式管理的命令实现。先给出对Hadoop文件系统进行管

2012-02-21 22:29:47 788

转载 Hadoop-0.20.0源代码分析(06)

在阅读Hadoop源代码过程中,在org.apache.hadoop.security.UnixUserGroupInformation类中,需要获取到Unix系统的用户名和所属组的信息,就需要通过执行Shell命令得到相应的结果,这里,通过阅读Hadoop项目org.apache.hadoop.util包、org.apache.hadoop.fs.shell包、org.apache.hadoop

2012-02-21 22:29:04 712

转载 Hadoop-0.20.0源代码分析(05)

以文件流作为一个切面,阅读Hadoop源代码org.apache.hadoop.fs包中源代码。关于流,分为输入流和输出流两种,下面也这样简单划分为两类进行阅读分析。输入流类与输入流相关的接口和类的继承层次关系如下所示:[java] view plaincopy◦java.io.InputStream(java.io.Clos

2012-02-21 22:28:29 620

转载 Hadoop-0.20.0源代码分析(04)

前面,分析了org.apache.hadoop.fs.Filesystem抽象类,我们已经了解到,要实现一个最基本的文件系统都需要包含哪些要点。下面具体到某个实现Filesystem的具体实现类,基于该抽象类Filesystem派生的类的继承关系:[java] view plaincopy◦org.apache.hadoop.fs.FileS

2012-02-21 22:27:56 631

转载 Hadoop-0.20.0源代码分析(03)

在Hadoop框架源代码org.apache.hadoop.fs包中,都是关于Hadoop文件系统实现的相关类,主要包括文件系统模型的建立,及其在该文件系统定义、实现基本的文件操作。例如给出文件系统抽象,对文件系统上存储的文件执行基本操作进行抽象,等等。在该包中,类的继承关系如下所示:[java] view plaincopy◦jav

2012-02-21 22:26:48 581

转载 Hadoop-0.20.0源代码分析(02)

UserGroupInformation类定义了一个与文件系统相关的用户和组信息抽象的内容,Hadoop框架实现了一个基于Unix系统的用户和组信息的实现类UnixUserGroupInformation,该类继承自UserGroupInformation抽象类。从UserGroupInformation抽象类与其子类UnixUserGroupInformation的属性字段可以看出,抽象

2012-02-21 22:26:08 420

转载 Hadoop-0.20.0源代码分析(01)

Hadoop 框架是两个模型实现的有机整合,亦即Hadoop分布式文件系统(HDFS)与MapReduce并行编程模型,也就是说,Hadoop框架要能够提供的基本功能就是,在存储系统HDFS上进行MapReduce并行计算,所以,如果想要了解Hadoop框架的工作原理和运行机制,主要从这两个方面着手。其实,Hadoop中MapReduce并行计算应该是在HDFS实现的,因此了解计算所基于H

2012-02-21 22:25:14 539

转载 kfs代码研究(磁盘异步IO)

磁盘IO在[qcdio/qcdiskqueue.h]和[qcdio/qcdiskqueue.cc]中实现,基于线程池和消费者/生产者模型。在这两个源文件中实现了基于成块读写的异步磁盘IO。[qcdio/qcdiskqueue.cpp] class QCDiskQueue::Queue,实现了磁盘文件的异步IO。文件读写的单位是块(支持direct-io)。它会启动给定数量(inThread

2012-02-21 00:14:09 463

Redis Cluster

Redis Cluster pdf

2012-11-18

VIM 高级 配置 使用 手册

VIM 高级 配置 使用 手册 VIM 高级 配置 使用 手册

2012-02-20

产品设计与用户体验(马化腾)

产品设计与用户体验(马化腾)

2012-02-20

Linux内核源代码导读 中国科学技术大学计算机系 陈香兰

Linux内核源代码导读 中国科学技术大学计算机系 陈香兰 Linux内核源代码导读 中国科学技术大学计算机系 陈香兰 Linux内核源代码导读 中国科学技术大学计算机系 陈香兰

2010-04-06

嵌入式Linux系统开发技术详解--基于ARM(完整版).pdf

嵌入式Linux系统开发技术详解--基于ARM(完整版).pdf 嵌入式Linux系统开发技术详解--基于ARM(完整版).pdf 嵌入式Linux系统开发技术详解--基于ARM(完整版).pdf

2010-04-06

ACM 培训教材 题目及答案

ACM 培训教材 第2章 递归与分治策略.pdf 第3章 动态规划.pdf 第4章 贪心算法.pdf 第5章 回溯法.pdf 第6章 分支限界法.pdf 基础训练题.doc ACM题目分类.doc

2010-04-05

编译原理国外经典中文版

编译原理国外经典中文版 编译原理国外经典中文版 编译原理国外经典中文版 编译原理国外经典中文版 编译原理国外经典中文版

2009-08-08

Writing Clean Code

Writing Clean Code!Writing Clean CodeWriting Clean CodeWriting Clean Code

2009-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除