Vincent乐-CSDN博客

转载结合Scikit-learn介绍几种常用的特征选择方法

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解拿到数据集，一个特征选择方法，往往很难同时完成这两个目的。通常情况下，我们经常不管三七二十一，选择一种自

2015-11-24 13:31:46 2372 1

原创机器学习/数据挖掘, Python 书籍推荐

1. 适合入门的读物：《深入浅出数据分析》这书挺简单的，基本的内容都涉及了，说得也比较清楚，最后谈到了R是大加分。难易程度：非常易。《啤酒与尿布》通过案例来说事情，而且是最经典的例子。难易程度：非常易。《数据之美》一本介绍性的书籍，每章都解决一个具体的问题，甚至还有代码，对理解数据分析的应用领域和做法非常有帮助。难易程度：易。《数学之美》这本书非常棒啦，入门读起来很

2015-04-16 17:32:15 11163 5

转载 CV 资源汇总

In the last couple of years there has been a trend on make code available for many of the state of the art papers. In most of the cases the code is Matlab -like scripts. Nevertheless, for heavy duty

2015-04-02 16:47:23 1922

原创计算机视觉会议查询

1. CVPapers - Computer Vision Resource http://www.cvpapers.com/index.html2. IEEE conferences http://www.ieee.org/conferences_events/index.html3. CV Calender http://www.ieee.o

2014-12-03 22:44:26 1437

转载计算机视觉代码+数据库汇总

Feature Detection and DescriptionGeneral Libraries: VLFeat – Implementation of various feature descriptors (including SIFT, HOG, and LBP) and covariant feature detectors (including DoG, Hess

2014-11-19 13:59:15 2693

原创 Linux下设置环境变量的几种方法

1.Linux的变量种类　　按变量的生存周期来划分，Linux变量可分为两类：　　1.1 永久的：需要修改配置文件，变量永久生效。　　1.2 临时的：使用export命令声明即可，变量在关闭shell时失效。2.设置变量的三种方法　　2.1 在/etc/profile文件中添加变量【对所有用户生效(永久的)】　　用VI在文件/etc/profile文

2014-11-12 14:10:09 1613

原创 Caffe+Ubuntu 13.10+ CUDA6.5 安装指南

1. 安装NVIDIA驱动 (3.4.0)输入下列命令添加驱动源sudo add-apt-repository ppa:xorg-edgers/ppasudo apt-get update安装340版驱动sudo apt-get install nvidia-340安装完成后, 继续安装下列包 (否则在运行sample时会报错)sudo a

2014-11-11 18:04:50 2655 1

转载 Python常用模块的安装方式

Python模块安装方法一、方法1：单文件模块直接把文件拷贝到 $python_dir/Lib二、方法2：多文件模块，带setup.py下载模块包，进行解压，进入模块文件夹，执行：python setup.py install三、方法3：easy_install 方式先下载ez_setup.py,运行python ez_setup 进

2014-11-04 15:16:29 13922

原创 Deep Learning: win7安装Theano,配置GPU

下载安装 AnacondaCE：AnacondaCE我安装在E:\AnacondaCE（去官网下载这个http://www.continuum.io/downloads，这个可是傻瓜式安装，然后再按照下面的步骤就可以成功配置了）http://repo.continuum.io/archive/index.html

2014-10-28 21:58:53 7631

原创近期会议总结

ICASSP2015: Brisbane, Australia. Oct 5,2014CVPR2015 Boston, USA. Nov,14,2014;ICME2015 Turlin, Italy. Nov 28, 2014.ICMR2015 Shanghai, Ch

2014-09-26 10:50:00 1653

原创 Leetcode:Word Search

Given a 2D board and a word, find if the word exists in the grid.The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or vertic

2014-09-07 01:32:11 1089

原创 LeetCode:Restore IP Addresses

Given a string containing only digits, restore it by returning all possible valid IP address combinations.For example:Given "25525511135",return ["255.255.11.135", "255.255.111.35"]. (Order

2014-09-06 12:19:46 846

原创 leetcode: N-Queues

N-QueensThe n-queens puzzle is the problem of placing n queens on ann×n chessboard such that no two queens attack each other.Given an integer n, return all distinct solutions to the n-queens p

2014-09-05 22:46:46 1184

转载回溯法

回溯法回溯法有“通用的解题法”之称。用它可以系统地搜索一个问题的所有解或任一解。回溯法是一种即带有系统性又带有跳跃性的搜索算法。它在问题的解空间树中，按深度优先策略，从根节点出发搜索解空间树。算法搜索至解空间树的任一结点时，先判断该节点是否包含问题的解。如果不包含，则跳过对以该节点为根的子树的搜索，逐层向其它祖先节点回溯。否则，进入该子树，继续按照深度优先策略搜索。回溯法求问题的所有解时，

2014-09-05 20:54:18 1363

原创 Leetcode: Word Ladder II

Given two words (start and end), and a dictionary, find all shortest transformation sequence(s) from start to end, such that:Only one letter can be changed at a timeEach intermediate word must exi

2014-09-05 20:04:09 1360

原创 Leetcode: Word Ladder

Given two words (start and end), and a dictionary, find the length of shortest transformation sequence from start to end, such that:Only one letter can be changed at a timeEach intermediate word m

2014-09-05 14:06:39 998

转载 LeetCode题目难度分布（含面试频率及使用的数据结构与算法）

原文链接：LeetCode Question Difficulty Distribution(墙外)ID Question Diff Freq Data StructureAlgorithms

2014-09-03 13:51:26 3521

原创概率面试题目总结

1. 三只骰子掷出10概率多少？

2014-09-02 10:51:44 1564

原创 Clustering算法、EM算法总结

K-means:K-medoids:Gaussian Mixture Model:Spectral Clustering:Hierarchical Clustering:Expectation Maximization:

2014-08-29 20:22:37 2277

原创朴素贝叶斯 VS 逻辑回归区别

1. Logistic Regression 逻辑回归

2014-08-29 12:46:42 10829 1

转载生成模型与判别模型

判别式模型与生成式模型的区别产生式模型(Generative Model)与判别式模型(Discrimitive Model)是分类器常遇到的概念，它们的区别在于：对于输入x，类别标签y：产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P(y|x)产生式模型可以根据贝叶斯公式得到判别式模型，但反过来不行。判别式模型常见的主要

2014-08-28 22:41:34 2214

原创字符串、数组算法总结

一、最大子序列和这里把最大子序列和放在第一个位置，它并不是字符串相关的问题，事实上它的目的是要找出由数组成的一维数组中和最大的连续子序列。比如[0，-2，3，5，-1，2]应返回9，[-9，-2，-3，-5，-3]应返回-2。

2014-08-25 21:52:24 1340

原创二叉树深度优先搜索（DFS）、广度优先搜索（BFS）

深度优先搜索算法（Depth First Search），是搜索算法的一种。是沿着树的深度遍历树的节点，尽可能深的搜索树的分支。当节点v的所有边都己被探寻过，搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点，则选择其中一个作为源节点并重复以上过程，整个进程反复进行直到所有节点都被访问为止。如右图所示的

2014-08-22 17:21:31 26537 1

原创图深度优先搜索（DFS）、广度优先搜索（BFS）

深度优先搜索（DFS）、广度优先搜索（BFS）图的邻接矩阵形式

2014-08-22 14:52:03 1553

转载 Catalan 数计算及应用

一、catalan数由来和性质1）由来 catalan数（卡塔兰数）取自组合数学中一个常在各种计数问题中出现的数列。以比利时的数学家欧仁·查理·卡塔兰 (1814–1894)命名。卡塔兰数的一般项公式为令其为h(n)的话，满足h(n)= h(0)*h(n-1)+h(1)*h(n-2) + ... + h(n-1)h(0) (n>=2)

2014-08-21 22:50:59 15463

原创 LeetCode:8.1 Subsets

Given a set of distinct integers, S, return all possible subsets.Note:Elements in a subset must be in non-descending order.The solution set must not contain duplicate subsets.For exa

2014-08-21 11:57:12 814

原创 LeetCode:2.1.6 Longest Consecutive Sequence

Given an unsorted array of integers, find the length of the longest consecutive elements sequence.For example,Given [100, 4, 200, 1, 3, 2],The longest consecutive elements sequence is [1, 2, 3

2014-08-20 21:19:20 959

原创排序，查找算法总结

首先引用一下《编程珠玑》中的两句话：尽管给了那么充裕的时间，只有大约10%的专业程序员能够写出正确的二分查找。尽管第一个二分查找程序于1946年就公布了，但是第一个没有bug的二分查找程序在1962年才出现。

2014-08-20 19:39:22 884

原创百度面试题：玻璃球临界值

题目如下：“有一个100层高的大厦，你手中有两个相同的玻璃围棋子。从这个大厦的某一层扔下围棋子就会碎，用你手中的这两个玻璃围棋子，找出一个最优的策略，来得知那个临界层面。”解答：

2014-08-13 22:45:57 2067

原创 Effective C++ 总结 (下)

，如果你定义了一个变量且该类型带一个构造函数或析构函数，当程序到达该变量时，你要承受构造成本，而离开作用域时，你要承受析构成本。为了减少这个成本，最好尽可能延后变量定义式的出现时间。举例说明：

2014-08-07 22:32:34 1506

原创 Effective C++ 总结 (中)

四.设计与声明条款18：让接口容易被正确使用，不易被误用理想上，如果客户企图使用某个接口而却没有获得他所预期的行为，这个代码不该通过编译；如果代码通过了编译，它的作为就该是客户所想要的。欲开发一个“容易被正确使用，不容易被误用”的接口，首先必须考虑客户可能做出什么样的错误。许多客户端错误可以因为导入新类型而获得预防。在

2014-08-07 21:50:59 934

原创 Effective C++ 总结 (上)

条款01：视C++为一个语言联邦为了更好的理解C++，我们将C++分解为四个主要次语言：C。说到底C++仍是以C为基础。区块，语句，预处理器，内置数据类型，数组，指针统统来自C。Object-Oreinted C++。这一部分是面向对象设计之古典守则在C++上的最直接实施。类，封装，继承，多态，virtual函数等等...Template C++。这是C++泛型编程部分。S

2014-08-06 21:27:00 1807

原创 C++ 智能指针

当类中有指针成员时，一般有两种方式来管理指针成员：一是采用值型的方式管理，每个类对象都保留一份指针指向的对象的拷贝（）；另一种更优雅的方式是使用智能指针，从而实现指针指向的对象的共享。智能指针(smart pointer)的一种通用实现技术是使用引用计数(reference count)。智能指针类将一个计数器与类指向的对象相关联，引用计数跟踪该类有多少个对象共享同一指针。

2014-08-06 17:23:50 851

原创红黑树删除

红黑树是一种特殊的二叉查找树，其删除结点首先要按二叉查找树删除结点的算法进行一、普通二叉查找树删除一个结点：(1)待删除结点没有子结点，即它是一个叶子结点，此时直接删除(2)待删除结点只有一个子结点，则可以直接删除；如果待删除结点是根结点，则它的子结点变为根结点；如果待删除结点不是根结点，则用它的子结点替代它的位置。(3)待删除结点有两个子结点，首先找出该结点的后继

2014-07-30 10:46:11 927

机器学习(Machine Learning, ML)的目的是根据给定的训练样本求对某系统输入输出之间依赖关系的估计，使它（这种关系）能够对未知输出做出尽可能准确地预测。机器学习至今没有一个精确的公认的定义。作为人工智能(Artificial Intelligence, AI)的一个重要研究领域，ML的研究工作主要围绕学习机理、学习方法和面向任务这三个基本方面进行研究。模式识别、函数逼近和概率密度估

2014-07-29 14:57:25 10832

原创 Stanford Machine Learning: (7). Clustering

Unsupervised learning - introductionTalk about clusteringLearning from unlabeled dataUnsupervised learningUseful to contras with supervised learningCompare and contrastSupervised l

2014-07-29 14:44:04 2098

原创 Stanford Machine Learning: (6).Large Scale Machine Learning

Learning with large datasetsThis set of notes look at large scale machine learning - how do we deal with big datasets?If you look back at 5-10 year history of machine learning, ML is much better n

2014-07-29 14:32:52 1410

原创 Stanford Machine Learning: (5). Support Vector Machines(SVM支持向量机)

Support Vector Machine (SVM) - Optimization objectiveSo far, we've seen a range of different algorithmsWith supervised learning algorithms - performance is pretty similarWhat matters more

2014-07-29 14:22:50 2704

大数据：互联网大规模数据挖掘与分布式处理

大数据互联网大规模数据挖掘与分布式处理，是学习分布式和数据挖掘的经典教材。

2013-09-06

绘制混淆矩阵程序

画ConfusionMtraix、AccuracyF PrecisionRecall的Matlab代码,含测试数据和demo文件

2013-12-02

cmvs和pmvs2可执行程序

cmvs+pmvs2：利用bundler得到的相机参数对无序图像进行三维重建，生成更稠密的点云，并写成ply格式的三维数据，用于三维重建，需要的可以下载

2013-06-18

pyramid bag of words 金字塔的词袋模型

pyramid bag of words 基于金字塔的词袋模型，网上的代码少了一个函数，经过修改已经能够运行，效果很好

2013-09-05

LSD直线检测

LSD直线检测算法具体程序实现，效果很好，需要的可以下载

2013-07-26

HOG+SVM代码及文档说明

文档包含了自己利用HOG+SVM制作样本和训练分类器的软件，以及基于C++和opencv实现的HOG+SVM源代码

2013-09-26

人脸识别工具箱

非常好的matlab人脸识别工具箱，里面包含了LLC，SVM，KNN-SRC，LASRC等经典算法，可以直接运行，效果非常好

2014-05-14

基于距离变换的手掌内接圆提取

自己写的一个基于距离变换 distanceTransform 的手掌最大内接圆提取程序，经过试验，效果非常好，内附程序说明

2013-10-19

GPSR优化包

GPSR是 Robust Face Recognition via Sparse Representation 论文中用来求解L1范数最小值的优化包，计算速度很快，可以直接使用

2014-06-19

libsvm3.1工具包

libsvm3.1 matlab工具包，里面包含了faruto的几种参数寻优方法，PSO,GA,GridSearch

2013-11-29

gco-v3.0代码

用于求解CRF,GraphCut的源代码，包含C++和matlab,内附程序说明

2013-11-13

lbfgs优化包

lbfgs优化算法，用matlab编写,包含测试函数，可以直接使用，非常方便

2013-12-03

liblbfgs代码

用于求解CRF的Lbfgs源代码,内附详细说明

2013-11-13

python2.7的numpy库

python2.7对应的numpy库，需要的可以下载

2013-08-03

CVPR2001-2005合集

包含了CVPR 2001-2005的所有论文,内容涉及特征提取，图像分割，目标跟踪，三维重建等

2013-11-13

OpenCV 2 Computer Vision Application Programming Cookbook

包含所有可以找到的关于OpenCV 2 Computer Vision Application Programming Cookbook的资料。官方高清电子书，配套代码，实验所需要图片。

2013-11-13

Kinect应用开发实战用最自然的方式与机器对话

由微软资深企业架构师兼Kinect应用开发专家亲自执笔，既系统全面地讲解了Kinect技术的工作原理，又细致深入地讲解了Kinect交互设计、程序开发和企业应用展望。全书不仅包含大量实践指导意义极强的实战案例，还包含大量建议和最佳实践，是学习Kinect for Windows应用开发不可多得的参考书。

2013-11-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

最新Cygwin1.7.9完整离线安装包

大数据：互联网大规模数据挖掘与分布式处理

绘制混淆矩阵程序

cmvs和pmvs2可执行程序

pyramid bag of words 金字塔的词袋模型

LSD直线检测

HOG+SVM代码及文档说明

人脸识别工具箱

基于距离变换的手掌内接圆提取

GPSR优化包

libsvm3.1工具包

gco-v3.0代码

lbfgs优化包

liblbfgs代码

python2.7的numpy库

CVPR2001-2005合集

OpenCV 2 Computer Vision Application Programming Cookbook

Kinect应用开发实战用最自然的方式与机器对话

空空如也