- 博客(445)
- 资源 (9)
- 收藏
- 关注
原创 NTU-Coursera机器学习:linear回归与logistic回归
线性回归问题例如,信用卡额度预测问题:特征是用户的信息(年龄,性别,年薪,当前债务,...),我们要预测可以给该客户多大的信用额度。 这样的问题就是回归问题。目标值y 是实数空间R。当XTX(X 的转置乘以X) 可逆时,可以通过矩阵运算直接求得w;不可逆时,直观来看情况就没这么简单。实际上,无论哪种情况,我们都可以很容易得到结果。因为许多现成的机器学习/数学库帮我们处理好了这个问题,只要我们直接调用相应的计算函数即可。有些库中把这种广义求逆矩阵运算成为 pseudo-inverse。关于Machine Le
2015-03-14 13:08:00 2186
原创 软考专题模块:数据流图
数据流图(DFD)是一种便于用户理解、分析系统数据流程的图形工具,是软件系统分析阶段用于描述系统逻辑模型的图形描述工具,用于回答软件系统“做什么”的问题,它摆脱了系统的物理内容,精确地在逻辑上描述系统的功能、输入、输出和数据存储等,是系统逻辑模型的重要组成部分。数据流图从数据传递和加工的角度,以图形的方式描述数据在系统流程中流动和处理的移动变换过程。关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2015-03-09 21:07:41 3713
原创 NTU-Coursera机器学习:机器学习基石 (Machine Learning Foundations)
这门课以8周设计,分成 4个核心问题,每个核心问题约需2周的时间来探讨.每个约2个小时的录影中,每个小时为一个主题,以会各分成4到5个小段落,每个段落里会有一个后多个随堂的练习.我们在探讨每个核心问题的第二周。关于Machine Learning更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2015-03-04 22:25:18 5274 3
原创 NTU-Coursera机器学习:HomeWork 2 Q16-20
基于[-1,1]上的均匀分布随机生成20个样本,相应的输出有20%的错误率;20个样本将数轴分为21段,中间有19段,θ取这19段的中点当中的一个,s取1或-1。遍历所有的θ和s,找到E-in最小的(θ,s)组合就得到了那个g函数。关于Machine Learning更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2015-03-04 22:17:48 2649
原创 NTU-Coursera机器学习:HomeWork 1 Q15-20
训练数据格式如下:输入有4个维度,输出为{-1,+1}。共有400条数据。 题目要求将权向量元素初始化为0,然后使用“Naive Cycle”遍历训练集,求停止迭代时共对权向量更新了几次。 所谓“Naive Cycle”指的是在某数据条目x(i)上发现错误并更新权向量后,下次从x(i+1)继续读数据,而不是回到第一条数据x(0)从头开始。该题要求使用“fixed,pre-determined random cycle”对数据进行遍历,即对400条数据进行随机排序,然后在这轮计算中始终使用这一排序,直到下一轮
2015-03-01 22:23:03 2817
原创 数理逻辑与集合论发展
本节通过数理逻辑发展史,了解有关的背景,加深对计算机学科的全面了解,特别是理论方面的了解,而不限于将计算机看成是一门技术或工程性的学科。通过重要的历史事件,了解计算机科学中的一些基本思维方式和一些基本问题。关于Discrete Mathematics更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2015-03-01 21:49:59 3182
原创 傅立叶变换(Fourier Transform)分析理解
引言关于傅立叶变换,无论是书本还是在网上可以很容易找到关于傅立叶变换的描述,但是大都是些故弄玄虚的文章,太过抽象,尽是一些让人看了就望而生畏的公式的罗列,让人很难能够从感性上得到理解,最近,我偶尔从网上看到一个关于数字信号处理的电子书籍,是一个叫Steven W. Smith, Ph.D.[1]外国人写的,写得非常浅显,里面有七章由浅入深地专门讲述关于离散信号的傅立叶变换.傅立叶变换的由来要理解傅
2015-03-01 21:48:18 12401
原创 NTU-Coursera机器学习:Noise and Error
目标函数识别指纹以区分合法身份与非法身份,这里的错误是0/1错误。一种是false reject叫错误拒绝,即本来合法的识别成了非法;另一种叫false accept叫错误接受,即本来非法的识别成了合法。应用中我们也不会真的把某些数据复制1000次,我们只需在计算Error时,将权重高的数据被拜访的概率提高1000倍即可,这与复制是等效的。不过,如果你是遍历整个测试集(不是抽样)来计算错误,就没必要修改拜访概率了,只需给相应的错误乘上它们的权重再相加并除以N即可。到现在为止,我们拓展了VC Bound,它在
2015-02-22 22:57:42 2132
原创 NTU-Coursera机器学习:VC Bound和VC维度
这一讲开篇再介绍一个界函数(bounding function)的概念.它提供了一个对机器学习结果可靠性的衡量,因为成长函数是N的多项式,所以BAD事件发生的概率随着N的增大而显著下降。需要强调的是,以上所讲的只适用于二元分类问题,因为我们在推导 break point、成长函数和边界函数时一直都基于二元分类这一前提.dichotomies数量的上限是成长函数.因为VC Bound对数据分布、目标函数、备选函数集、学习算法都没有要求,它牺牲了部分精确性,换来了无所不包的一般性。这使得VC Bound具有哲学
2015-02-22 15:51:59 10607 2
原创 NTU-Coursera机器学习:机器学习的可行性 & 训练与测试
映射中最关键的点是讲抽样中橙球的概率理解为样本数据集D上h(x)错误的概率,以此推算出在所有数据上h(x)错误的概率,这也是机器学习能够工作的本质,即我们为啥在采样数据上得到了一个假设,就可以推到全局呢?因为两者的错误率是PAC的,只要我们保证前者小,后者也就小了。具体来说,假如有两个相似的备选函数h1≈h2 ,则h1与h2在D上几乎是同好或同坏的,或曰B1与B2高度相关,P[B1]与P[B2]可以合并,但Union Bound却将他们相加了。解决过分估计的问题,可以将备选函数集分类,相似的函数分在一起。关
2015-02-07 18:24:39 4196
原创 NTU-Coursera机器学习:Types of Learning
本节总体思路:按照输出空间类型分Y,数据标记类型分yn,不同目标函数类型分f和不同的输入空间类型分X .其中按照输出空间类型Y,可以分为二元分类,多元分类,回归分析以及结构化学习等,这个好理解,离散的是分类,连续的是回归,到是结构化的学习接触的相对较少,而相对二元分类,当然有多元分类问题。例如,美分硬币共有四种(1、5、10、25美分),输入数据为(尺寸,重量),输出集合{η}={1美分,5美分,10美分,25美分}。这是一个4分类问题。一般的讲,多元分类问题的输出可表示为: {η}={ 1, 2,···,
2015-02-06 23:48:42 2504
原创 NTU-Coursera机器学习:機器學習問題与二元分類
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.(与Tom M. Mitchell的定义一致). 简而言之,就是我们想要机器在某些方面有提高(如搜索排名的质量,即N
2015-02-02 18:57:00 2838
转载 浅谈我对机器学习的理解
=============在网上看到关于一篇ML的文章,很不错,转载过来共勉=============算算时间,从开始到现在,做机器学习算法也将近八个月了。虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升。实话说,机器学习很难,非常难,要做到完全了解算法的流程、特点、实现方法,并在正确的数据面前选择正确的方法再进行优化得到最优效果,我觉得没有个八年
2015-02-01 09:08:47 2028 1
原创 支持向量机SVM整理
支持向量机在解决小样本、非线性及高维模式识别问题中表现出了许多特有的优势,针对多类分类问题的经典SVM 算法主要有一对一方法(1-vs-1),一对多方法(1-vs-all.线性可分问题SVM 是从线性可分情况下的最优分类面发展而来的,所谓最优分类面就是要求分类面不但能将两类样本正确分开(训练错误率为0),而且使分类间隔最大.设有n 个样本xi 及其所属类别yi 表示为:超平面W·X+b=0 方程,
2015-01-12 16:47:52 5440
原创 程序设计基石与实践之标记控制和计数器控制的循环
一个有10名学生的班级进行了一次测验,测验成绩(1~100中的一个整数)现在都已经出来了.请计算并打印本班学生的总成绩及班级的平均成绩.我们知道,班级的平均成绩等于总成绩除以学生的人数.使用计数器控制的循环以一次一个的方式输入每个学生的成绩.这种方法用一个称为计数器的变量控制一组语句运行次数.在此,给出了一个已完全开发好的伪代码算法以及GradeBook类的一个版本,其中,GradeBook类在一个C++成员函数中实现了算法.关于Program Language更多讨论与交流,敬请关注本博客和新浪微博son
2015-01-10 20:35:15 2467
原创 24点计算问题
问题描述:N个1到13之间的自然数,找出所有能通过加减乘除计算(每个数有且只能用一次)得到24的组合?计算24点常用的算法有三种,第一种方法:任取两个数,计算后,将结果放回去,再从剩下的数中任取两个,如此反复直到只剩下一个数;第二种方法:先构建前缀/后缀表达式,再计算该表达式;第三种方法是用集合保存中间结果,集合间两两进行合并计算得到新集合(或者对给定的一个集合,对其所有的子集合进行合并计算)如果要推广到n个数,有两种思路:① 采用前缀/后缀表达式。相当于将n个数用n-1个括号括起来,其数目就是一个catl
2015-01-09 19:41:57 4678 2
原创 程序设计基石与实践之C++语言接口与实现分离
接口定义并标准化了人和系统等诸如此类事物彼此交互的方式.每个类定义包含了类的公有成员函数的完整定义及其私有数据成员声明.可是更好的软件工程是在类定义的外部定义成员函数,这样这些成员函数的实现细节对客户代码而言隐藏的,这种方式保证程序员不会写出依赖于类的实现细节的客户代码.否则,若类的实现更改,则客户代码将更可能"遭到损坏".关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2015-01-08 19:44:41 1965
原创 程序设计基石与实践之使用构造函数初始化对象
每一个类都可以提供一个构造函数,用于类对象创建时的初始化.构造函数是一种特殊的成员函数,定义时必须和类同名,这样编译器才能够将它和类的其他成员函数区分开来.构造函数各其他函数之间的一个重大差别是构造函数不能返回值,因此对它们不可以指定返回类型.通常情况下,构造函数声明为public.关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2015-01-06 23:03:02 1728
原创 程序设计基石与实践之数据成员与set和get函数
在博文<<程序实践:定义具有成员函数的类 >>介绍了GradeBook类表示可供教师管理学生考试成绩的成绩簿,在本博介结具有一个数据成员,一个Set函数和一个 Get函数的GradeBook类 .关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2015-01-06 22:23:30 1772
原创 程序设计基石与实践之定义具有成员函数的类
现在从一个由GradeBook类和main函数组成的例子说起,此例是一系例循序渐进例子中的第一个,这些例子通过后续博文讲解,最终是一个功能众多的GradeBook类.这里,GradeBook类表示可供教师管理学生考试成绩的成绩簿,而在main函数创建了一个GradeBook对象.main函数使用这个对象和它的成员函数,在屏幕上显示一条欢迎教师进入成绩簿程序的信息.PS:关键字class后跟类名GradeBook.按照惯例,用户定义的类名字以大写字母开头,而且为了增强可读性,类名中每个随后的单词其首字母也为大
2015-01-03 16:51:54 1680
原创 程序设计基石与实践之应用多态性的工资发放系统
本博文通过包含了一个公司支付系统中各种雇员情况的一个继承层次来讨论基类和派生类之间的关系.佣金雇员(表示为一个基类对象)的薪水完全是销售提成,带底薪佣雇员(表示为一个派生类的对象)的薪水由底薪和销售提成组成.以及创建一个增强的雇员类层次结构我们使用抽象类Employee表示通常概念的雇员.直接从Employee类派生的是类SalariedEmployee,CommissionEmployee 和HourlyEmployee.而BasePlusCommissionEmployee类又是从CommissionE
2014-12-31 23:11:24 3842
原创 历年真题软件设计师下午考试题汇分析与技巧
软件设计师级别的试题题型基本固定:第一题为结构化分析与设计,主要考查数据流图DFD的绘制, 第二题为数据库分析与设计,主要考查ER图的绘制以及ER图与关系模式的映射, 第三题为面向对象分析与设计,主要考查对常用UML图形的掌握情况,比较常见的图形包括用例图、类图、顺序图、活动图和状态图,考查形式为图形填空,附带考查UML的一些基础知识, 第四题为数据结构与算法,主要考查对常用数据结构和算法的掌握情况,通常考查一些中等难度的算法,例如最短装配时间算法、B树、贪心算法、动态规划
2014-12-27 13:25:40 13827 5
翻译 关于Netflix Prize的总结
矩阵分解技术和模型组合方法可能是与Netflix Prize有关最多被讨论的算法。似乎基于矩阵分解的模型是最精确,并想将这些矩阵分解模型加上被时间效应和二元观点所需要提供的重要灵活性。虽然如此,已经在大多数文献中占很主导的邻居模型仍然会继续流行,这根据他的实际特点——无需训练就能够处理新的用户评分并提供推荐的直接解释。关于Machine Learning&Pattern Recognition更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-12-19 14:09:47 7989 3
原创 如何学习离散数学和在计算机科学中应用
离散数学的定义及其在各学科领域的重要作用。离散数学(Discrete mathematics)是研究离散量的结构及其相互关系的数学学科,是现代数学的一个重要分支。它在各学科领域,特别在计算机科学与技术领域有着广泛的应用,同时离散数学也是计算机专业的许多专业课程,如程序设计语言、数据结构、操作系统、编译技术、人工智能、数据库、算法设计与分析、理论计算机科学基础等必不可少的先行课程。通过离散数学的学习,不但可以掌握处理离散结构的描述工具和方法,为后续课程的学习创造条件,而且可以提高抽象思维和严格的逻辑推理能力,
2014-12-18 20:45:26 13082 4
原创 程序实践系列之利用2D数组的GradeBook类
介绍类GradeBook,使用一个二维数组存储学生在多次考试所得的成绩.在一个学期中,学生很可能参加多次考试,老师也可能希望分析一个学生或整个班级在整个学期所获得成绩.关于程序设计基石与实践更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-12-07 13:11:21 2795
原创 程序实践系列(十):C++流和文件流
编写一个程序,输入一系列的数据(学号、姓名、成绩)存放在文件stud.dat中。输出这些学生数据和相应的成绩等级(≥90为优,80~89为良,70~79为中,60~69为及格,≤59为不及格).关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-11-21 20:43:14 1823
原创 程序实践系列(九)多态性和虚函数
设计一个评选优秀教师和学生的程序,其类结构如下图所示。当输入一系列教师或学生的记录后,将优秀学生及教师的姓名列出来,并采用相关数据进行测试.解析:设计一个基类base,含纯虚函数isgood(),由base类派生出类student和类teacher,分别包含纯虚函数针对学生和教师为优秀的定义。关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-11-07 20:29:13 2010
原创 程序基石系列(十四) 虚析构函数
用一个例子来说明虚析函数的必要性.在程序中,基类A的构造函数动态分配5个字节,其析构函数负责释放这块内存.派生类Z的构造函数动态分配5000个字节,其析构函数负责释放这块内存.由于类A和Z的构造函数与析构函数输出了跟踪信息.通过定义基类的析构函数~A()为虚成员函数,可以确保其派生类的析构函数也为虚成员函数.为了使代码更清晰,我们可以明确地使用关键字virtual来声明~Z(),不过即使我们不这样做,~Z()仍然为虚成员函数,由于析构函数已经声明为虚成员函数,当通过ptr来删除其所指针的对象时,编译器进行的
2014-11-06 12:19:22 1252
原创 半色调技术简介
连续调图像与半色调图像 在我们的日常生活中,所遇到的图像可大致分为两大类:连续调图像(Continuuos-Tone Image)和半色调图像(Haltfnoe Image)。如我们常见的彩色照片就是一种连续调图像,在这种图像上,存在着由淡到浓或由深到浅的色调变化并且浓淡或深浅是以单位面积成像物质颗粒密度来构成的,并且这种图像的深浅变化有无数多级。另外印刷工艺中的照相分色底片的连续调,是由单位面积
2014-11-06 09:11:18 18022 3
原创 程序基石系列之C++多态的前提条件
C++中多态(polymorphism)有以下三个前提条件: 必须存在一个继承体系结构. 继承体系结构中的一些类必须具有同名的virtual成员函数(virtual关键字)至少有一个基类类型的指针或基类类型的引用.这个指针或引用可用来对virtual成员函数进行调用.关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-10-31 19:45:13 2282
原创 程序实践系列(七)C++概述
在面向过程的程序设计中,数据只被看成是一种静态的结构,它只有等待调用函数来对它进行处理。在面向对象的程序设计中,将数据和对该数据进行合法操作的函数封装在一起作为一个类的定义;另外,封装还提供一种对数据访问严格控制的机制,因此,数据将被隐藏在封装体中,该封装体通过操作接口与外界交换信息。 关于Program Language更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-10-24 20:56:26 1321
原创 程序实践系列(八)继承与派生
设计一个人员类person.其中包括姓名和衣服、裤子及鞋子的指针;将其衣服、裤子及鞋子分别设计成类clothes、pants和shoe的对象,这3个类都是从物品类object派生的, object类包括物品类型和颜色数据成员;并采用相关数据进行测试。
2014-10-24 18:01:03 2023 2
原创 程序实践系列(六)运算符重载 "+" 和"-"
设计一个时间类CTime,包括时、分、秒等私有数据成员。要求实现时间的基本运算,如一时间加上另一时间、一时间减去另一时间等。
2014-10-17 19:14:22 1691
原创 程序实践系列(五)引用和friend
1. 设计一个类CSample,它有一个私有数据成员n,建立该类的4个对象,即s1(n=10)、 s2(n=20)、s3(n=30)和s4(n=40),建立一个成员函数实现这些对象n值的累加,但要求不使用静态数据成员,而且对象自已不能与自己相加。 2. 设计一个日期类CDate,包括日期的年份、月份和日号,编写一个友元函数求两个日期之间相差的天数。
2014-10-10 19:34:51 1758
原创 程序实践系列(四)使用类设计整数集合类
设计整数集合类Set,该类包括以下数据成员: int elem[N]; //存放集合元素 int num; //集合中最后一个元素位置 和以下成员函数: Set(); //默认构造函数 Set(int a[],ints); //以数组a的元素和位置s构造一个集合 void empty();
2014-09-26 21:51:06 4530 2
原创 程序实践系列之Tic-Tac-Toe实现
程序编程实训Tic-Tac-Toe实现.关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-08-10 14:49:24 7200
原创 非零点之间聚类
在二值图像中,非零点之间的进行聚类,使用矩形框进行标记其区域过程中,主要解决相邻的两个矩形框之间重叠区域和嵌套现象。仅作参考.注:因开发周期只有几个小时地时间.代码有不规范地方,请各位见谅.关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-08-10 11:34:28 1643
原创 图像处理职位面试题汇总(6)
为了提高算法运行速度,可以有哪些方法(写你了解的、用过的)?什么是内存碎片?对系统能有何影响?如何在开发中尽量避免内存碎片?我们的算法研究主要分为应用算法研究和基础研究,在图像处理、模式识别方向,你觉得用算未予研究可以用到哪些场合(比如:车辆识别,人脸识别)?图像特征:了解哪些图像像相关的特征(特征描述,特征算子),并举例用什么地方?关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-06-24 16:23:58 7186
原创 程序实践系列之库源代码
/* * File: stdgen.h * Version: 1.0.0关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-06-24 12:52:35 2234 2
原创 椭圆轮廓识别
首先,从图像中检测出轮廓,然后再从轮廓中检索出椭圆轮廓。关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.
2014-06-01 19:50:02 4565 1
深度学习课程信息图
2018-09-02
C中的继承和多态
2015-11-06
A survery of steganographic techniques
2009-12-17
Schriftenreihe Information und Recht
2009-12-17
Networking for Computer Games
2009-12-11
Multimedia Forensics and Security
2009-11-30
[浙 江 大 学硕士学位论文]图像插值与离散曲面去噪(2006)
2009-11-25
Random forests(Leo Breiman)
2009-11-22
Mesh Generation(Mark Filipiak)
2009-11-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人