- 博客(26)
- 收藏
- 关注
原创 windows远程桌面配置CUDA
最近自己机器上的GPU坏了,实验室远程服务器上也安装了GPU,就准备配好用起来。在安装好CUDA Toolkit后(https://developer.nvidia.com/cuda-downloads)发现没法运行。这个toolkit是包含驱动的,不需要提前安装驱动。原来windows远程桌面是RDP协议,是不能调用显卡资源的(新的K20等可能直接就能调用)。网上高手们给出的答案是利用
2014-12-30 10:07:19 13312 1
原创 多类分类器
在分类问题中,多类问题的处理方式通常有如下两种方法:one vs. all (one vs. rest)The one-vs.-rest (or one-vs.-all, OvA or OvR) strategy involves training a single classifier per class, with the samples of that class as po
2014-12-25 14:08:19 1354
原创 C++下一些常用操作的实现
利用windows自带的win32 API。 vector list_dir(const string & path){ cout << path << endl; vector files; WIN32_FIND_DATA fd; HANDLE hFind = ::FindFirstFile(path.c_str(), &fd); if (hFind != INVALID_HA
2014-09-16 15:10:52 683
原创 python画图
python下面画图的包是matplotlib(http://matplotlib.org/),想要运行这个包,一般都要安装Numpy和Scipy包。安装好,具体执行的时候,可能还需安装setuptools包、dateutil包和pyparsing包,这些包如何安装只要google就可以。下面是一个画图的具体例子。from pylab import *import matplo
2014-04-17 21:17:44 1482
原创 自我学习与半监督学习的区别
From http://deeplearning.stanford.edu/wiki/index.php/Self-Taught_LearningThere are two common unsupervised feature learning settings, depending on what type of unlabeled data you have. The more ge
2014-03-26 17:16:41 1696
原创 吴立德教授深度学习课程笔记
复旦大学 吴立德教授 深度学习(Deep Learning)课程(http://www.youku.com/playlist_show/id_21508721.html),老先生讲得很细致,非常推荐。直接利用Deep Neural Networks的问题:以前机器学习的数据量不是很大(标记数据更少),而DNN待学习的参数非常的多(Andrew Ng在Google搞的那个有1.15b
2014-01-08 15:48:19 5253 4
原创 在Linux下为每行增加行号
awk '$0=NR":"$0' filename其中,$0表示原来每行的内容,NR表示行号,双引号之间表示行号与原来内容之间的delimiter,最后是待添加行号的文件名。
2013-12-14 09:38:12 9072
原创 归一化
我们在处理数据的时候,经常会遇到量纲不一样的情况。例如1元和1角,数值都为1,但是谁大呢?这种情况对我们人而言,已经是常识了,但是对机器呢?还有我们不熟悉的情况呢?这就需要归一化(normalization),我们需要将它们映射到统一的一个区间,使得在这个区间内直接对它们操作是合理的。在知乎上我一个同学是这样回答的“归一化首先在维数非常多的时候,可以防止某一维或某几维对数据影响过大,其次可以程序可
2013-12-11 10:09:31 8469 1
原创 静态链表表示二叉树
静态链表就是利用数组来模拟一个链表存储,所以需要一个游标来指示下一个元素存储在数组哪儿(即指示了下一个元素的下标)。下面的程序就是利用一个静态链表来存储了一个二叉树(二叉树的结构如图所示):具体代码如下:#include using namespace std;typedef struct{ char data; int left; int right;} s
2013-11-14 16:12:57 2292
原创 vl_feat库中的k-means聚类
最近准备好好看一下vl_feat库。首先简单介绍一下vl_feat库(http://www.vlfeat.org/index.html)。vl_feat库是用C语言开发的一个开源的计算机视觉的库,它比opencv要小,但是实现了一些比较常见的视觉方面的算法(包括HOG,SIFT, MSER, k-means, hierarchical k-means, agglomerative info
2013-09-28 14:16:47 6226 1
原创 统计排序的代价
Google Code Jam上的第三题是“Moist”问题。具体要求如下:ProblemMoist has a hobby -- collecting figure skating trading cards. His card collection has been growing, and it is now too large to keep in one disorg
2013-09-24 23:08:11 905
原创 C++中输出设置有效位和计算机中浮点数的保存问题
Google Code Jam上的第二题是“Captain Hammer”问题。具体描述如下:ProblemThe Hamjet is a true marvel of aircraft engineering. It is a jet airplane with a single engine so powerful that it burns all of its fuel
2013-09-24 22:46:15 1284
原创 二部图判断
这几天没事,就做了Google Code Jam上的3道练习题。第一题是“Bad Horse”,具体的描述如下:ProblemAs the leader of the Evil League of Evil, Bad Horse has a lot of problems to deal with. Most recently, there have been far too
2013-09-24 22:15:53 2307
原创 一个最大堆的实现(最基本的功能)
参考了算法导论上的堆排序算法,实现了如下最大堆。只有最基本的功能,最后利用该最大堆实现了堆排序(非递减排序)。代码如下:max_heap_sort.h:#define PARENT(i) ((i - 1)/2)#define LEFT(i) (2*i + 1)#define RIGHT(i) (2*i + 2)void max_heapify(vector & vec_ints,
2013-09-05 10:47:12 732
原创 C++链式栈的简单实现(只有基本功能)
本文用C++简单实现一个链式栈(只有最基本的功能)。代码如下:List_Stack.hstruct Node { int value; Node * next;};class List_Stack{private: Node * top; int size;public: List_Stack(); int get_size(); bool is_empty()
2013-09-05 10:38:08 921
原创 C++ TCP socket通信
实现了C++下的TCP socket通信。由于不知道发送/接收信息的长度,因此,实现中先发送消息的长度,然后再发送消息内容;接收也一样,先接收消息长度,然后再接收消息的具体内容。实现代码在Linux下测试通过。server端的代码如下:#include #include #include #include #include #include #include #include
2013-07-16 13:54:43 1762
原创 MapReduce的并行执行效率
从搭好Hadoop集群之后,再上面跑了一些程序,由于数据量较小,得到实验结果的时间也还可以忍受,因此也就没有关注MapReduce并行执行效率这方面的问题。后来跑了几个大的数据集,都发现非常的慢,于是就不得不关系效率方面的问题了。查看任务管理器的时候发现有很多处理器是没有利用的,只有一两个的利用率较高,与我们对MapReduce的直觉相差很大,于是问了一个一直在研究Hadoop的同学,发现我们
2013-05-11 21:41:30 2059
原创 MapReduce中Reducer与reduce的关系
同一个Reducer可能会接收多个key的记录,但是同一个key的记录会在一个单独的reduce中处理,因此就涉及到参数的作用域的问题。有时候我们会在Reducer中初始化一些公共参数(可以在setup中初始化),然后在reduce中使用。要注意,这些公共参数是所有reduce共有的,如果不注意比较容易出错,例如对一个int型变量施加自加或者自减操作,常常以为是从0开始操作的,其实它在其他ke
2013-03-25 11:30:01 1558
原创 MapReduce里面的二次排序、组排序和Partitioner
在MapReduce程序中,我们常常需要对属于同一个key的value进行排序,即“二次排序”,将key和value进行组合,合并成一个新的key,给map去排序。在Hadoop 1.0.4中,利用setSortComparatorClass()对二次排序进行设定,但是sort comparator需要自己实现一个comparator,下面是一个自己实现的comparator的例子。 pu
2013-03-24 14:51:24 1521 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人