自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 2015下半年的总结

2015下半年的总结趁着心烦意乱,趁着毫无状态,趁着生活一团乱麻,也许这个时候写下来的感想才有助于梳理思路,才能给自己的心情一份净土。 今天,也才算是能够确定搭了这么久的环境,调了这么久的bug到底能不能做得出来,到底能不能继续下去。四个月,可以说是四个月,期间学会了游泳,拿到了驾照,回到过西安,畅游过厦门,游学过无锡,第一次做了义工,第一次走上讲台给大一的小朋友讲课,第一次做腹肌撕裂者,第一次过

2015-12-10 16:29:11 661

原创 长沙星沙考场科目三注意事项

科目三考试需要注意事项如下:1. 模拟夜间灯光u 请开启前照灯u 夜间在有路灯的道路上行驶:打开前照灯不变u 夜间在没有路灯的道路上行驶:仍旧打开前照灯,再打开远光灯u 夜间在道路上发生故障,难以移动:关闭前照灯,关闭远光灯,打开示廓灯和危险警报灯u 夜间直行,通过路口:关闭上述所有灯光,打开前照灯u 夜间在有路灯的道路上与机动车会车:仍旧打开前照灯u 夜间通过急弯

2015-10-29 10:42:21 6779

原创 Online random forest

Online randomforest1. online learning的概念对于online learning,他的数据是come in sequence也就是说training sample是一个一个来,或者是几个几个来,然后classifier根据新来的sample进行更新。Online Learning是比较困难的,主要是你无法知道将来的数据是如何的。显然SVM和Adaboost

2015-10-22 08:09:57 1281

原创 2015-10-15

看了不少东西,本来应该看论文的,结果一拖再拖,明天不能拖下去了。明天下午把论文看完,然后给Ristin回一封邮件。人家这么及时也不容易,我也不能放下人家论文就不愿意看了。今日总结:1.      拓扑数据分析与机器学习的相互促进http://www.csdn.net/article/2015-10-09/2825872虽然对于TDA并不是非常清楚,但是为后面做视觉提供了一个非常好的

2015-10-15 22:00:57 524

原创 神经网络neural networks+决策树decision tree 组合算法

之前总结了近十几年,本来想做随机森林的,结果没有,因此总结了神经网络和决策树相结合的算法,但是由于原总结资料电子版已经遗失,于是,将之前留下的纸质版拍照扫描下来进行保存,本人版权,转载请注明出处。

2015-10-15 15:37:28 5897 2

转载 数据归一化总结

数据归一化总结1.目的:数据归一化的目的是为了把不同来源的数据统一到一个参考系下,这样比较起来才有意义。 2.由于各种各样的原因,标准的k-means算法并没有直接用于categorical数据。categorical数据的样本空间是离散的,并没有一个天然的可供欧氏距离使用的原点。因此欧氏距离函数对于这样一个空间并没有真正的意义。I do not recommendconverting

2015-10-15 15:20:13 3427

原创 Munzekonza_random_forestinstallation guide

Munzekonza_random_forestinstallation guide I.         Installation environment Ubuntu 14.04LTS,Matlab R2014aII.       Installation librariesLibraryVersionRemarks

2015-10-15 15:14:38 663

原创 Review in Incremental Learning

1. 初识计算机视觉计算机视觉(Computer Vision, CV)是近十几年来计算机科学中最热门的方向之一,而我个人是在上学期学习随机森林算法的时候,由于随机森林一个应用领域就是人脸识别,人脸识别是计算机视觉方面尤为突出的领域,于是我开始关注计算机视觉。后来在阅读文献的过程中,我发现视觉的很多领域如人脸识别、视觉检测以及3D扫描打印等等都非常火热,尤其是图像识别准确率由腾讯优图团队的

2015-10-15 14:57:51 947

原创 Sklearn中的随机森林

Sklearn是python的机器学习算法的包,在整个机器学习过程中具有非常好的口碑。我把最近看的一些东西加上自己做实验的理解做了一份总结。1.      随机森林介绍随机森林是一种统计学习理论,其随机有两个方面:首先在训练的每一轮中,都是对原始样本集有放回的抽取固定数目的样本点,形成k 个互不相同的样本集。第二个点是:对于每一个决策树的建立是从总的属性中随机抽取一定量的属性作为分裂属性集

2015-10-14 18:54:34 8770 3

原创 2010-10-12

2015-10-12今日总结:1.      读到《Does deep learning comefrom the Devil?》中,Vapnik和Intrator教授说,婴儿的学习无需数以亿计的标记样本。换句话说,从巨量标记数据中学习很有效,但如果仅仅依赖于此,会让我们蔽目于学习的本质原理。也许今天这些算法从巨量数据中才能学到的,其实只需几百样本,如果真是如此,那我们是败给了在学习本质原

2015-10-12 21:04:27 353

原创 2015-10-10

2015-10-10今日总结:今天是一个十全十美的日子,以史上最差的成绩进行了验收科目二,只是教练的验收,不过没什么,突然换一辆车还能做好,想想自己也不容易,棒棒的。也终于学会了游泳,今天虽然游泳时间长,但有人指导下毕竟还是好的。想了想,自己最近一直在让自己运动让自己开心,习惯了一个人游泳一个人吃饭一个人玩,也并不无聊。长大了成熟了,这也是我对自己越来越满意的方面。1.      随机

2015-10-11 22:29:10 290

原创 2015-10-08

2015-10-08今日总结:一.OpenCV 人脸识别FaceRecogniser人脸识别使用的三种方法:1.      Eigenfaces(seecreateEigenFaceRecogniser())2.      Fisherfaces(seecreateFisherFaceRecognizer())3.      Local Binary PatternsHisto

2015-10-08 22:03:14 460

转载 计算机视觉:随机森林算法在人体识别中的应用

摘 要人体识别是计算机视觉领域的一大类热点问题,其研究内容涵盖了人体的监测与跟踪、手势识别、动作识别、人脸识别、性别识别和行为与事件识别等,有着非常广泛的应用价值。随机森林以它自身固有的特点和优良的分类效果在众多的机器学习算法中脱颖而出。随机森林算法的实质是一种树预测器的组合,其中每一棵树都依赖于一个随机向量,森林中的所有的向量都是独立同分布的。本文简单介绍了随机森林的原理,并对近几年来随

2015-10-08 10:52:07 5039 1

转载 2015-09-24

---------------------------------------------------------------------------------------------------转载---------------------------------------------------------------------------------------------------

2015-09-24 22:38:19 572

原创 2015-09-23

2015-09-22二分均值簇:昨天研究了针对某一特殊问题的解决方案,今天克服k-means算法收敛于局部最小值的问题一个常用的解决思路,即二分k-means。算法首先将所有点作为一个簇,然后将该簇一分为2。之后选择其中一个簇进行划分,选择哪一个簇进行划分取决于对其划分是否可以最大程度降低SSE的值。上述基于SSE的划分过程不断重复,直到得到用户指定数目的簇为止。二分k-均值算法的伪代

2015-09-23 15:40:25 272

原创 2015-09-21

常用的欧氏距离kmeans方法的问题:1.       为什么常见的kmeans方法效果较差?k-均值算法收敛但聚类效果较差的原因是,k-均值算法收敛到了局部最小值,而非全局最小值(局部最小值指结果还可以但并非最好结果,全局最小值是可能的最好结果)。2.如何改进kmeans算法?一种用于度量聚类效果的指标是SSE(Sum of Squared Error,误差平方和)。SSE值越小

2015-09-21 23:10:46 385

原创 2015-09-20

2015-09-20http://scikit-learn.org/stable/modules/ensemble.html1.      Ensemble methods is to combinethe predictions of several base estimators built with a given learningalgorithm in order to impr

2015-09-20 21:33:34 345

转载 过拟合问题以及解决方法

一.所谓过拟合问题为了得到一致假设而使假设变得过度复杂称为过拟合。一个过配的模型试图连误差(噪音)都去解释(而实际上噪音又是不需要解释的),导致繁华能力较差,显然过犹不及了。A model (e.g., network) that is too complex may fit the noise, not just thesignal, leading to overfitting.Pro

2015-09-20 21:28:50 3871

转载 干货:结合Scikit-learn介绍几种常用的特征选择方法

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种自

2015-09-20 21:27:52 677

原创 2015-09-19

2015-09-19今天貌似做了很多事情,但是也有很多事情是没有实现预期的。今日总结:1.      python中,序列(如列表和元组)和映射(字典)是两类主要的容器。序列中每个元素以编号进行区分,而映射中每个元素都有一个名字(也就是键)。2.      python遇到-1不会报错,会从最后一个元素开始计算。3.      学车半天,学习半天,看硅谷一个晚上,看到那些疯狂的

2015-09-19 22:17:10 287

原创 2015-09-18

今天是个特殊的日子,一直以来都想好好梳理一下自己乱糟糟随心所欲的生活,今天也终于下定决心,痛彻心扉的反思自己,总结自己。不求对自己有多大帮助,至少不再是混沌度日,改一改射手座洒脱随性的性子,争取效率高一些完成每日的任务和生活。也希望这样自己能做到学习生活两不误。也希望某一天回首研究生生涯的时候,不是懊恼,不是纠结,而是一段想玩就玩,该学就学的真实的有意义的生活。 今日总结: 1.早上完成昨

2015-09-18 22:43:36 376

转载 g++与gcc的区别

这几天初学Linux下的C/C++编程,有些体会,写下来分享一下。首先编写了第一个C++程序,Hello,world!#include using namespace std;void main()...{cout return;}用命令:GCC -o test test.cpp编译,有问题。然后分析,即分开运行GCC.GCC -c -o

2015-08-31 09:57:24 327

转载 Mex 文件

简介编辑MEX从字面上是MATLAB和Executable 两个单词的缩写。.MEX文件是一种可在matlab环境中调用的C(或fortran)语言衍生程序,MEX文件的后缀名按32位/64位分别为 .mexw32/.mexw64。MEX文件是由C或Fortran语言编写的源代码,经matlab编译器处理而生成的二进制文件。它是可以被matlab解释器自动装载并执行的动态链接程序,

2015-08-30 11:19:46 521

转载 linux下修改path

linux 修改path有3种方法:1.直接在命令行里敲PATH=$PATH:/path1:/path2:/pathN,用户登出之后PATH恢复原样.2.修改~目录下bash_profile,找到PATH=$PATH:$HOME/bin这一行,直接在后面加:/path1:/path2就行.然后source .bash_profile,这个只对当前用户生效3.修改/etc/profi

2015-08-30 11:05:58 329

原创 云计算入门的一些小知识

1.云计算不同于分布式计算 分布式计算是将

2014-05-05 17:47:17 478

转载 hadoop2.x常用端口及定义方法

Hadoop集群的各部分一般都会使用到多个端口,有些是daemon之间进行交互之用,有些是用于RPC访问以及HTTP访问。而随着Hadoop周边组件的增多,完全记不住哪个端口对应哪个应用,特收集记录如此,以便查询。这里包含我们使用到的组件:HDFS, YARN, HBase, Hive, ZooKeeper:组件节点默认端口配置用途说明H

2014-05-04 16:10:35 6866

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除