- 博客(17)
- 资源 (2)
- 收藏
- 关注
原创 台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课我们介绍了过拟合发生的原因:excessive power, stochasti...
2017-05-26 12:59:27 5429 3
原创 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换...
2017-05-24 09:23:16 4283
原创 台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们介绍了分类问题的三种线性模型,可以用来解决binary classifi...
2017-05-22 20:54:27 4603
原创 台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们介绍了Logistic Regression问题,建立cross-ent...
2017-05-17 21:42:38 5516 5
原创 台湾大学林轩田机器学习基石课程学习笔记10 -- Logistic Regression
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们介绍了Linear Regression线性回归,以及用平方错误来寻找最...
2017-05-15 22:03:11 9702 3
翻译 机器学习中的维度灾难
一、介绍本篇文章,我们将讨论所谓的“维度灾难”,并解释在设计一个分类器时它为何如此重要。在下面几节中我将对这个概念进行直观的解释,并通过一个由于维度灾难导致的过拟合的例子来讲解。考虑这样一个例子,我们有一些图片,每张图片描绘的是小猫或者小狗。我们试图构建一个分类器来自动识别图片中是猫还是狗。要做到这一点,我们首先需要考虑猫、狗的量化特征,这样分类器算法才能利用这些特征对图片进行分类。例如我们可以通过
2017-05-11 20:31:39 14102 4
原创 台湾大学林轩田机器学习基石课程学习笔记9 -- Linear Regression
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课,我们主要介绍了在有noise的情况下,VC Bound理论仍然是成立的。同时,...
2017-05-10 23:53:34 7418 5
原创 简述Hadoop和Spark的异同
谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。解决问题的层面不一样首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的
2017-05-10 12:29:27 2081
原创 台湾大学林轩田机器学习基石课程学习笔记8 -- Noise and Error
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们主要介绍了VC Dimension的概念。如果Hypotheses se...
2017-05-09 21:45:28 7522
原创 Ubuntu 16.04 Spark单机环境搭建
说道大数据和机器学习,就少不了Spark.本文主要介绍在Linux下搭建单机环境的Spark的步骤。安装Java SE1、下载JAVA SE linux版本。下载地址为: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html注意选择Linux版本,根据机器类型选择32位或者64位。2、
2017-05-07 14:33:56 14379 3
原创 台湾大学林轩田机器学习基石课程学习笔记7 -- The VC Dimension
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释。机器能够学习必须满足两个条...
2017-05-05 09:38:05 9346 5
原创 Python pickle模块和joblib模块浅析
在Python中,如果希望透明地存储对象,而不丢失其身份和类型等信息,则需要某种形式的对象序列化,这是一个将任意复杂的对象转成对象的文本和二进制表示的过程。同样,必须能够将对象经过序列化后的形式恢复到原来的对象。这种序列化的过程称为pickle,可以将对象pickle成字符串、磁盘上的文件或者任何类似于文件的对象;反序列化的过程就是将这些字符串、文件或任何类似于文件的对象unpickle成原来的对
2017-05-03 23:04:10 25800 2
原创 Python, CPython, Pypy, Jython的简单介绍
简单地说,Python是一门编程语言,任何一种编程语言都需要用另一种语言来实现它,比如C语言就是用机器语言来实现的。所以,Python根据实现方式不同分为了CPyhton、Pypy、Jython等。CPythonCPython是用C语言实现Pyhon,是目前应用最广泛的解释器。Python最新的语言特性都是在这个上面先实现,Linux,OS X等自带的也是这个版本,包括Anaconda里面用的也是C
2017-05-03 17:48:51 20549 1
原创 台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们主要探讨了当M的数值大小对机器学习的影响。如果M很大,那么就不能保证机器...
2017-05-03 14:09:03 9096 6
原创 台湾大学林轩田机器学习基石课程学习笔记5 -- Training versus Testing
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课,我们主要介绍了机器学习的可行性。首先,由NFL定理可知,机器学习貌似是不可行的...
2017-05-02 22:15:12 8846 15
原创 台湾大学林轩田机器学习基石课程学习笔记4 -- Feasibility of Learning
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课,我们主要介绍了根据不同的设定,机器学习可以分为不同的类型。其中,监督式学习中的...
2017-05-02 16:38:23 9929 24
原创 台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning
我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA。PLA能够在平面中选择一...
2017-05-02 09:16:01 7750
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人