自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

翻译 ROC

ROC曲线(Receiver Operating Characteeristic Curve)是显示Classification模型真正率和假正率之间折中的一种图形化方法。 解读ROC图的一些概念定义:: 真正(True Positive , TP)被模型预测为正的正样本 假...

2013-05-16 16:48:44

阅读数 642

评论数 0

转载 机器学习会议

ICML: international conference of machine learning ICIP: international conference on image processing         ICCV: international conference on...

2013-05-16 16:47:20

阅读数 1066

评论数 0

转载 Weka3.5中使用LibSVM

Dr. Y.Bao推荐数据试验中最好用上SVM的分类方法,让我们在Weka中使用LibSVM,我在网上差了半天,看到许多相同的被转来转去的帖子都讲得人晕头转向,尤其是像我这种Java基础不牢固的人更是不知所以,弄了半天走了不少弯路,不过最后总算是让我把LibSVM集成进Weka了,下面就以我自己的...

2013-01-15 23:32:35

阅读数 9081

评论数 0

原创 ICA扩展描述

7. ICA算法扩展描述      上面介绍的内容基本上是讲义上的,与我看的另一篇《Independent Component Analysis: Algorithms and Applications》(Aapo Hyvärinen and Erkki Oja)有点出入。下面总结一下这篇文章...

2013-01-08 23:16:01

阅读数 666

评论数 0

原创 独立成分分析(Independent Component Analysis)

1. 问题:      1、上节提到的PCA是一种数据降维的方法,但是只对符合高斯分布的样本点比较有效,那么对于其他分布的样本,有没有主元分解的方法呢?      2、经典的鸡尾酒宴会问题(cocktail party problem)。假设在party中有n个人,他们可以同时说话,我们也在房...

2013-01-08 23:15:12

阅读数 504

评论数 0

转载 主成分分析(Principal components analysis)-最小平方误差解释

3.2 最小平方误差理论            假设有这样的二维样本点(红色点),回顾我们前面探讨的是求一条直线,使得样本点投影到直线上的点的方差最大。本质是求直线,那么度量直线求的好不好,不仅仅只有方差最大化的方法。再回想我们最开始学习的线性回归等,目的也是求一个线性函数使得直线能够最佳拟合...

2013-01-08 23:14:20

阅读数 830

评论数 0

转载 主成分分析(Principal components analysis)-最大方差解释

在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关系,只能是边学边体会了。PCA以前也叫做Principal factor analys...

2013-01-08 23:13:14

阅读数 818

评论数 1

翻译 在线学习(Online Learning)

原题目叫做The perception and large margin classifiers,其实探讨的是在线学习。这里将题目换了换。以前讨论的都是批量学习(batch learning),就是给了一堆样例后,在样例上学习出假设函数h。而在线学习就是要根据新来的样例,边学习,边给出结果。  ...

2013-01-08 23:12:12

阅读数 958

评论数 0

翻译 K-means聚类算法

K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。      聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都...

2013-01-08 23:10:49

阅读数 602

评论数 0

翻译 规则化和模型选择Regularization and model selection

1 问题      模型选择问题:对于一个学习问题,可以有多种模型选择。比如要拟合一组样本点,可以使用线性回归,也可以用多项式回归。那么使用哪种模型好呢(能够在偏差和方差之间达到平衡最优)?      还有一类参数选择问题:如果我们想使用带权值的回归模型,那么怎么选择权重w公式里的参数? 形...

2013-01-08 23:10:04

阅读数 484

评论数 0

翻译 SVM(6)

11 SMO优化算法(Sequential minimal optimization) SMO算法由Microsoft Research的John C. Platt在1998年提出,并成为最快的二次规划优化算法,特别针对线性SVM和数据稀疏时性能更优。关于SMO最好的资料就是他本人写的《Se...

2013-01-08 23:08:26

阅读数 587

评论数 0

翻译 SVM(5)

9 规则化和不可分情况处理(Regularization and the non-separable case) 我们之前讨论的情况都是建立在样例线性可分的假设上,当样例线性不可分时,我们可以尝试使用核函数来将特征映射到高维,这样很可能就可分了。然而,映射后我们也不能100%保证可分。那怎么...

2013-01-08 23:07:27

阅读数 349

评论数 0

翻译 SVM(4)

7 核函数(Kernels) 考虑我们最初在“线性回归”中提出的问题,特征是房子的面积x,这里的x是实数,结果y是房子的价格。假设我们从样本点的分布中看到x和y符合3次曲线,那么我们希望使用x的三次多项式来逼近这些样本点。那么首先需要将特征x扩展到三维,然后寻找特征和结果之间的模型。我们将这...

2013-01-08 23:06:19

阅读数 495

评论数 0

翻译 SVM(2)

6 拉格朗日对偶(Lagrange duality)      先抛开上面的二次规划问题,先来看看存在等式约束的极值问题求法,比如下面的最优化问题:              目标函数是f(w),下面是等式约束。通常解法是引入拉格朗日算子,这里使用来表示算子,得到拉格朗日公式为 ...

2013-01-08 23:05:30

阅读数 482

评论数 0

翻译 SVM(1)

1 简介 支持向量机基本上是最好的有监督学习算法了。最开始接触SVM是去年暑假的时候,老师要求交《统计学习理论》的报告,那时去网上下了一份入门教程,里面讲的很通俗,当时只是大致了解了一些相关概念。这次斯坦福提供的学习材料,让我重新学习了一些SVM知识。我看很多正统的讲法都是从VC 维理论和结构风...

2013-01-08 23:04:32

阅读数 493

评论数 0

翻译 判别模型、生成模型与朴素贝叶斯方法

1判别模型与生成模型 上篇报告中提到的回归模型是判别模型,也就是根据特征值来求结果的概率。形式化表示为,在参数确定的情况下,求解条件概率。通俗的解释为在给定特征后预测结果出现的概率。 比如说要确定一只羊是山羊还是绵羊,用判别模型的方法是先从历史数据中学习到模型,然后通过提取这只羊的特征来预测出...

2013-01-08 23:01:40

阅读数 906

评论数 0

翻译 线性回归,logistic回归和一般回归

作为一个机器学习初学者,认识有限,表述也多有错误,望大家多多批评指正。 1 摘要       本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题,回归属于有监督学习中的一种方法。该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于...

2013-01-08 22:59:51

阅读数 672

评论数 0

原创 混合高斯模型mixture Gaussians和EM算法

这篇讨论使用期望最大化算法(Expectation-Maximization)来进行密度估计(density estimation)。       与k-means一样,给定的训练样本是,我们将隐含类别标签用表示。与k-means的硬指定不同,我们首先认为是满足一定的概率分布的,这里我们认为...

2013-01-08 22:56:52

阅读数 1429

评论数 0

翻译 迁移学习 transfer learning

迁移学习( Transfer Learning )  在传统的机器学习的框架下,学习的任务就是在给定充分训练数据的基础上来学习一个分类模型;然后利用这个学习到的模型来对测试文档进行分类与预测。然而,我们看到机器学习算法在当前的Web挖掘研究中存在着一个关键的问题:一些新出现的领域中的大量训练...

2013-01-08 22:50:59

阅读数 741

评论数 0

转载 分类器:Cart,bagging,random forest boosting

本文从统计学角度讲解了CART(Classification And Regression Tree), Bagging(bootstrap aggregation), Random Forest Boosting四种分类器的特点与分类方法。 CART(Classif...

2013-01-08 22:45:50

阅读数 968

评论数 0

原创 线性分类器之 logistic regression与neural networks的关系

logistic  regression和neural networks 的区别和联系: Logistic regression 的本质是线性分类器,但是在做完线性变化后,结果又通过sigmoid函数做非线性变换,sigmoid函数是神经网络中处理非线性现象(nonlinear saturatio...

2013-01-08 22:41:33

阅读数 1206

评论数 0

原创 关注机器学习的最新热点方向

目前机器学习最热门的领域有以下七个,后面给出相应的资料链接: 1. 迁移学习 Transfer learning 。 http://www.cse.ust.hk/TL/index.html  2.  半监督学习Semi-Supervised learning 。 http://pages.cs...

2013-01-08 22:21:04

阅读数 1966

评论数 0

原创 Symbian CAknSettingItemList使用心得

1,实例化 setting item list 时,一定要遵守下面的顺序:1) CAknSettingItemList *pList = new (ELeave) CAknSettingItemList derived class2) pList->SetContainerWindowL(*...

2008-11-14 13:24:00

阅读数 719

评论数 0

原创 How to Create Dynamic Settings Pages

Create Dynamic Settings PagesHow to Create Dynamic Settings Pages Many times there are situations where you want to create settings pages dynamically...

2008-11-14 13:22:00

阅读数 681

评论数 0

原创 Creating a CAknEnumeratedTextPopupSettingItem-derived class to use dynamic data at runtime

In this article, I will introduce another way -- creating a CAknEnumeratedTextPopupSettingItem-derived class to use dynamic data at runtimeAn importa...

2008-11-14 13:10:00

阅读数 753

评论数 0

原创 (三)

 4    生成(Build )ARM  目的文件  4.1      概述      针对ARMI 的生成(Build)工作总体上比针对WINS 的要困难得多,因此,从一开始就寻找由gcc报告的额外编译错误和报警信息就是再正常不过了。首先这是由于: 在很多情况下gcc 比微软的编译器要严格得多,...

2008-08-25 17:07:00

阅读数 358

评论数 0

原创 Symbian OS C++程序员编码诀窍 (二)

 3    系统资源的使用(ROM 和 RAM )   3.1      重要性        移动电话是一种资源有限设备。然而,它却存在大量的可用功能,这对现有的系统资源提出了很高的要求。开发者需要注意这些制约,尽可能地少用这些有限的资源。 3.2      减少代码量      最终编译后的代...

2008-08-25 16:37:00

阅读数 393

评论数 0

原创 symbian知识一---- Symbian OS C++程序员编码诀窍 (一)

1    简介 1.1      读者对象和范围     本文的读者对象是:所有使用C++语言为Symbian OS 6.x/7.0s 开发应用的开发伙伴们。    有一个不成文的80/20 法则,说的是:需要用80%的时间去纠正开发中产生的20%的问题。本文的目的就是要解决这20%的问题。   ...

2008-08-25 15:31:00

阅读数 497

评论数 0

原创 Windows下多线程编程技术及其实现

  本文首先讨论16位Windows下不具备的线程的概念,然后着重讲述在32位Windows 95环境下多线程的编程技术,最后给出利用该技术的一个实例,即基于Windows95下TCP/IP的可视电话的实现。   一、问题的提出   作者最近在开发基于Internet网上的可视电话过程中,碰到了这...

2008-08-22 13:49:00

阅读数 494

评论数 0

原创 C# 日志操作情形

//添加数据库文件IO引用using System.IO;using System.Text;using System.Data;using System.Data.SqlClient;public class IISLogFile{   private string LogSoftware; p...

2007-11-20 17:28:00

阅读数 1981

评论数 0

原创 Linux 内核剖析

Linux® 内核是一个庞大而复杂的操作系统的核心,不过尽管庞大,但是却采用子系统和分层的概念很好地进行了组织。在本文中,您将探索 Linux 内核的总体结构,并学习一些主要的子系统和核心接口。您还可以通过其他 IBM 文章的链接更深入地进行学习。由于本文的目标是对 Linux 内核进行介绍并探索...

2007-09-13 22:33:00

阅读数 429

评论数 0

原创 串口学习

 1,什么是串口?2,什么是RS-232?3,什么是RS-422?4,什么是RS-485?5,什么是握手?1,什么是串口?串口是计算机上一种非常通用设备通信的协议(不要与通用串行总线Universal Serial Bus或者USB混淆)。大多数计算机包含两个基于RS232的串口。串口同时也是仪器...

2007-09-13 00:26:00

阅读数 615

评论数 0

原创 ado学习

 ADO是为MS的强大的数据访问接口 OLE DB 设计的,上一个便于使用的应用程序层。 OLE DB 为任何数据源都提供了高性能的访问,包括:关系型数据库、非关系型数据库、电子邮件、文件系统、文本和图形以及自定义业务对象等。    ADO 2.0 实际上是基于 MSADO15.DLL 这个动态链...

2007-09-13 00:11:00

阅读数 594

评论数 0

原创 使用ADO封装类的数据库程序开发实例

源代码运行效果图如下: 一、前言用过ADO的人都知道, 调用ADO要处理很多"麻烦"的事情,如异常处理等,要写很多try - catch块. 有点不甚其烦。我干脆把常用的函数都封装起来,免去老是要写try - catch块的麻烦。做起来虽然没有什么技术含量,但也比较烦琐,所以只...

2007-09-13 00:04:00

阅读数 854

评论数 0

原创 ADO接口简介

 ADO库包含三个基本接口:_ConnectionPtr接口、_CommandPtr接口和_RecordsetPtr接口。 _ConnectionPtr接口返回一个记录集或一个空指针。通常使用它来创建一个数据连接或执行一条不返回任何结果的SQL语句,如一个存储过程。使用_ConnectionPtr...

2007-09-12 23:47:00

阅读数 481

评论数 0

原创 在Visual C++中如何利用UDL文件来建立ADO连接

使用通用数据连接文件(*.UDL,以下简称文件)来创建ADO连接,可以和ODBC一样可视化地定义要连接的数据源,从而实现数据访问的透明性。 1.使用UDL文件来创建ADO连接 创建ADO的连接,首先要设置ADO连接对象的ConnectionString属性,该属性提供所要连接的数据库类型、数据所处...

2007-09-12 23:45:00

阅读数 499

评论数 0

原创 VC 实现adox2

 在上一篇文章《ADO第一次亲密接触》中我们详细介绍了ADO基本的操作方法,在实际的开发过程中我们常常需要存储较大的二进制数据对象,比如:图像、音频文件、或其它二进制数据,这些数据我们称之为二进制大对象BLOB(Binary Large Object),其存取的方式与普通数据有所区别。本文将介绍利...

2007-09-12 23:43:00

阅读数 733

评论数 0

原创 VC 实现adox1

一、ADO简介ADO(ActiveX Data Object)是Microsoft数据库应用程序开发的新接口,是建立在OLE DB之上的高层数据库访问技术,请不必为此担心,即使你对OLE DB,COM不了解也能轻松对付ADO,因为它非常简单易用,甚至比你以往所接触的ODBC API、DAO、RDO...

2007-09-12 23:41:00

阅读数 793

评论数 0

原创 VC实现简单Http连接

一、引 言 ---- Windows Socket API是一套开放的、支持多种协议的Windows下的网络编程接口,它包 括一个标准的 Berkeley Socket功能调用的集合,以及为Windows所作的重要扩充。 Windows Socket经过不断完善并在众 多公司的全力支持下,已成为W...

2007-09-12 23:35:00

阅读数 1336

评论数 0

原创 C++大型项目开发约束

 第一章简介大型软件项目通常由相应的大型开发团队承担。大型团队生成的代码要有项目范围内可评测的质量,代码必须遵从于某一标准并以此来评价。因此,对大型的项目团队来说,建立一个编程的标准或一组指南很重要。使用编程标准也使以下各项成为可能: 增加开发过程代码的强壮性、可读性、易维护性;减少有经验...

2007-08-29 11:37:00

阅读数 5490

评论数 0

提示
确定要删除当前文章?
取消 删除