- 博客(265)
- 资源 (20)
- 收藏
- 关注
转载 结合Scikit-learn介绍几种常用的特征选择方法
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种自
2015-11-24 13:31:46
2257
1
原创 机器学习/数据挖掘, Python 书籍推荐
1. 适合入门的读物:《深入浅出数据分析》这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。《啤酒与尿布》通过案例来说事情,而且是最经典的例子。难易程度:非常易。《数据之美》一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。难易程度:易。《数学之美》这本书非常棒啦,入门读起来很
2015-04-16 17:32:15
11017
5
转载 CV 资源汇总
In the last couple of years there has been a trend on make code available for many of the state of the art papers. In most of the cases the code is Matlab -like scripts. Nevertheless, for heavy duty
2015-04-02 16:47:23
1862
原创 计算机视觉 会议 查询
1. CVPapers - Computer Vision Resource http://www.cvpapers.com/index.html2. IEEE conferences http://www.ieee.org/conferences_events/index.html3. CV Calender http://www.ieee.o
2014-12-03 22:44:26
1364
转载 计算机视觉 代码+数据库 汇总
Feature Detection and DescriptionGeneral Libraries: VLFeat – Implementation of various feature descriptors (including SIFT, HOG, and LBP) and covariant feature detectors (including DoG, Hess
2014-11-19 13:59:15
2636
原创 Linux下设置环境变量的几种方法
1.Linux的变量种类 按变量的生存周期来划分,Linux变量可分为两类: 1.1 永久的:需要修改配置文件,变量永久生效。 1.2 临时的:使用export命令声明即可,变量在关闭shell时失效。2.设置变量的三种方法 2.1 在/etc/profile文件中添加变量【对所有用户生效(永久的)】 用VI在文件/etc/profile文
2014-11-12 14:10:09
1541
原创 Caffe+Ubuntu 13.10+ CUDA6.5 安装指南
1. 安装NVIDIA驱动 (3.4.0)输入下列命令添加驱动源sudo add-apt-repository ppa:xorg-edgers/ppasudo apt-get update安装340版驱动sudo apt-get install nvidia-340安装完成后, 继续安装下列包 (否则在运行sample时会报错)sudo a
2014-11-11 18:04:50
2603
1
转载 Python常用模块的安装方式
Python模块安装方法一、方法1: 单文件模块直接把文件拷贝到 $python_dir/Lib二、方法2: 多文件模块,带setup.py下载模块包,进行解压,进入模块文件夹,执行:python setup.py install三、 方法3:easy_install 方式 先下载ez_setup.py,运行python ez_setup 进
2014-11-04 15:16:29
13742
原创 Deep Learning: win7安装Theano,配置GPU
下载安装 AnacondaCE:AnacondaCE我安装在E:\AnacondaCE(去官网下载这个http://www.continuum.io/downloads,这个可是傻瓜式安装,然后再按照下面的步骤就可以成功配置了)http://repo.continuum.io/archive/index.html
2014-10-28 21:58:53
7543
原创 近期会议总结
ICASSP2015: Brisbane, Australia. Oct 5,2014CVPR2015 Boston, USA. Nov,14,2014;ICME2015 Turlin, Italy. Nov 28, 2014.ICMR2015 Shanghai, Ch
2014-09-26 10:50:00
1601
原创 Leetcode:Word Search
Given a 2D board and a word, find if the word exists in the grid.The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or vertic
2014-09-07 01:32:11
1031
原创 LeetCode:Restore IP Addresses
Given a string containing only digits, restore it by returning all possible valid IP address combinations.For example:Given "25525511135",return ["255.255.11.135", "255.255.111.35"]. (Order
2014-09-06 12:19:46
794
原创 leetcode: N-Queues
N-QueensThe n-queens puzzle is the problem of placing n queens on ann×n chessboard such that no two queens attack each other.Given an integer n, return all distinct solutions to the n-queens p
2014-09-05 22:46:46
1141
转载 回溯法
回溯法回溯法有“通用的解题法”之称。用它可以系统地搜索一个问题的所有解或任一解。回溯法是一种即带有系统性又带有跳跃性的搜索算法。它在问题的解空间树中,按深度优先策略,从根节点出发搜索解空间树。算法搜索至解空间树的任一结点时,先判断该节点是否包含问题的解。如果不包含,则跳过对以该节点为根的子树的搜索,逐层向其它祖先节点回溯。否则,进入该子树,继续按照深度优先策略搜索。回溯法求问题的所有解时,
2014-09-05 20:54:18
1300
原创 Leetcode: Word Ladder II
Given two words (start and end), and a dictionary, find all shortest transformation sequence(s) from start to end, such that:Only one letter can be changed at a timeEach intermediate word must exi
2014-09-05 20:04:09
1309
原创 Leetcode: Word Ladder
Given two words (start and end), and a dictionary, find the length of shortest transformation sequence from start to end, such that:Only one letter can be changed at a timeEach intermediate word m
2014-09-05 14:06:39
947
转载 LeetCode题目难度分布(含面试频率及使用的数据结构与算法)
原文链接:LeetCode Question Difficulty Distribution(墙外)ID Question Diff Freq Data StructureAlgorithms
2014-09-03 13:51:26
3365
原创 Clustering算法、EM算法总结
K-means:K-medoids:Gaussian Mixture Model:Spectral Clustering:Hierarchical Clustering:Expectation Maximization:
2014-08-29 20:22:37
2200
转载 生成模型 与 判别模型
判别式模型与生成式模型的区别产生式模型(Generative Model)与判别式模型(Discrimitive Model)是分类器常遇到的概念,它们的区别在于:对于输入x,类别标签y:产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P(y|x)产生式模型可以根据贝叶斯公式得到判别式模型,但反过来不行。判别式模型常见的主要
2014-08-28 22:41:34
2135
原创 字符串、数组 算法总结
一、最大子序列和这里把最大子序列和放在第一个位置,它并不是字符串相关的问题,事实上它的目的是要找出由数组成的一维数组中和最大的连续子序列。比如[0,-2,3,5,-1,2]应返回9,[-9,-2,-3,-5,-3]应返回-2。
2014-08-25 21:52:24
1294
原创 二叉树 深度优先搜索(DFS)、广度优先搜索(BFS)
深度优先搜索算法(Depth First Search),是搜索算法的一种。是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。当节点v的所有边都己被探寻过,搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点,则选择其中一个作为源节点并重复以上过程,整个进程反复进行直到所有节点都被访问为止。如右图所示的
2014-08-22 17:21:31
26394
1
转载 Catalan 数计算及应用
一、catalan数由来和性质1)由来 catalan数(卡塔兰数)取自组合数学中一个常在各种计数问题中出现的数列。以比利时的数学家欧仁·查理·卡塔兰 (1814–1894)命名。卡塔兰数的一般项公式为 令其为h(n)的话,满足h(n)= h(0)*h(n-1)+h(1)*h(n-2) + ... + h(n-1)h(0) (n>=2)
2014-08-21 22:50:59
15077
原创 LeetCode:8.1 Subsets
Given a set of distinct integers, S, return all possible subsets.Note:Elements in a subset must be in non-descending order.The solution set must not contain duplicate subsets.For exa
2014-08-21 11:57:12
766
原创 LeetCode:2.1.6 Longest Consecutive Sequence
Given an unsorted array of integers, find the length of the longest consecutive elements sequence.For example,Given [100, 4, 200, 1, 3, 2],The longest consecutive elements sequence is [1, 2, 3
2014-08-20 21:19:20
918
原创 排序,查找算法 总结
首先引用一下《编程珠玑》中的两句话: 尽管给了那么充裕的时间,只有大约10%的专业程序员能够写出正确的二分查找。尽管第一个二分查找程序于1946年就公布了,但是第一个没有bug的二分查找程序在1962年才出现。
2014-08-20 19:39:22
850
原创 百度面试题 :玻璃球 临界值
题目如下:“有一个100层高的大厦,你手中有两个相同的玻璃围棋子。从这个大厦的某一层扔下围棋子就会碎,用你手中的这两个玻璃围棋子,找出一个最优的策略,来得知那个临界层面。”解答:
2014-08-13 22:45:57
2006
原创 Effective C++ 总结 (下)
,如果你定义了一个变量且该类型带一个构造函数或析构函数,当程序到达该变量时,你要承受构造成本,而离开作用域时,你要承受析构成本。为了减少这个成本,最好尽可能延后变量定义式的出现时间。举例说明:
2014-08-07 22:32:34
1457
原创 Effective C++ 总结 (中)
四.设计与声明 条款18:让接口容易被正确使用,不易被误用 理想上,如果客户企图使用某个接口而却没有获得他所预期的行为,这个代码不该通过编译;如果代码通过了编译,它的作为就该是客户所想要的。 欲开发一个“容易被正确使用,不容易被误用”的接口,首先必须考虑客户可能做出什么样的错误。 许多客户端错误可以因为导入新类型而获得预防。在
2014-08-07 21:50:59
896
原创 Effective C++ 总结 (上)
条款01:视C++为一个语言联邦 为了更好的理解C++,我们将C++分解为四个主要次语言:C。说到底C++仍是以C为基础。区块,语句,预处理器,内置数据类型,数组,指针统统来自C。Object-Oreinted C++。这一部分是面向对象设计之古典守则在C++上的最直接实施。类,封装,继承,多态,virtual函数等等...Template C++。这是C++泛型编程部分。S
2014-08-06 21:27:00
1749
原创 C++ 智能指针
当类中有指针成员时,一般有两种方式来管理指针成员:一是采用值型的方式管理,每个类对象都保留一份指针指向的对象的拷贝();另一种更优雅的方式是使用智能指针,从而实现指针指向的对象的共享。 智能指针(smart pointer)的一种通用实现技术是使用引用计数(reference count)。智能指针类将一个计数器与类指向的对象相关联,引用计数跟踪该类有多少个对象共享同一指针。
2014-08-06 17:23:50
786
原创 红黑树 删除
红黑树是一种特殊的二叉查找树,其删除结点首先要按二叉查找树删除结点的算法进行一、普通二叉查找树删除一个结点:(1)待删除结点没有子结点,即它是一个叶子结点,此时直接删除(2)待删除结点只有一个子结点,则可以直接删除;如果待删除结点是根结点,则它的子结点变为根结点;如果待删除结点不是根结点,则用它的子结点替代它的位置。(3)待删除结点有两个子结点,首先找出该结点的后继
2014-07-30 10:46:11
884
转载 关于SVM的一些理解
机器学习(Machine Learning, ML)的目的是根据给定的训练样本求对某系统输入输出之间依赖关系的估计,使它(这种关系)能够对未知输出做出尽可能准确地预测。机器学习至今没有一个精确的公认的定义。作为人工智能(Artificial Intelligence, AI)的一个重要研究领域,ML的研究工作主要围绕学习机理、学习方法和面向任务这三个基本方面进行研究。模式识别、函数逼近和概率密度估
2014-07-29 14:57:25
10770
原创 Stanford Machine Learning: (7). Clustering
Unsupervised learning - introductionTalk about clusteringLearning from unlabeled dataUnsupervised learningUseful to contras with supervised learningCompare and contrastSupervised l
2014-07-29 14:44:04
2035
原创 Stanford Machine Learning: (6).Large Scale Machine Learning
Learning with large datasetsThis set of notes look at large scale machine learning - how do we deal with big datasets?If you look back at 5-10 year history of machine learning, ML is much better n
2014-07-29 14:32:52
1339
原创 Stanford Machine Learning: (5). Support Vector Machines(SVM支持向量机)
Support Vector Machine (SVM) - Optimization objectiveSo far, we've seen a range of different algorithmsWith supervised learning algorithms - performance is pretty similarWhat matters more
2014-07-29 14:22:50
2586
GPSR优化包
2014-06-19
OpenCV 2 Computer Vision Application Programming Cookbook
2013-11-13
Kinect应用开发实战用最自然的方式与机器对话
2013-11-13
pyramid bag of words 金字塔的词袋模型
2013-09-05
cmvs和pmvs2可执行程序
2013-06-18
最新Cygwin1.7.9完整离线安装包
2013-06-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人