自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

红色石头的专栏

个人网站:redstonewill.com

  • 博客(17)
  • 资源 (2)
  • 收藏
  • 关注

原创 台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课我们介绍了过拟合发生的原因:excessive power, stochasti...

2017-05-26 12:59:27 5429 3

原创 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换...

2017-05-24 09:23:16 4283

原创 台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们介绍了分类问题的三种线性模型,可以用来解决binary classifi...

2017-05-22 20:54:27 4603

原创 台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们介绍了Logistic Regression问题,建立cross-ent...

2017-05-17 21:42:38 5516 5

原创 台湾大学林轩田机器学习基石课程学习笔记10 -- Logistic Regression

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们介绍了Linear Regression线性回归,以及用平方错误来寻找最...

2017-05-15 22:03:11 9702 3

翻译 机器学习中的维度灾难

一、介绍本篇文章,我们将讨论所谓的“维度灾难”,并解释在设计一个分类器时它为何如此重要。在下面几节中我将对这个概念进行直观的解释,并通过一个由于维度灾难导致的过拟合的例子来讲解。考虑这样一个例子,我们有一些图片,每张图片描绘的是小猫或者小狗。我们试图构建一个分类器来自动识别图片中是猫还是狗。要做到这一点,我们首先需要考虑猫、狗的量化特征,这样分类器算法才能利用这些特征对图片进行分类。例如我们可以通过

2017-05-11 20:31:39 14102 4

原创 台湾大学林轩田机器学习基石课程学习笔记9 -- Linear Regression

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课,我们主要介绍了在有noise的情况下,VC Bound理论仍然是成立的。同时,...

2017-05-10 23:53:34 7418 5

原创 简述Hadoop和Spark的异同

谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。解决问题的层面不一样首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的

2017-05-10 12:29:27 2081

原创 台湾大学林轩田机器学习基石课程学习笔记8 -- Noise and Error

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们主要介绍了VC Dimension的概念。如果Hypotheses se...

2017-05-09 21:45:28 7522

原创 Ubuntu 16.04 Spark单机环境搭建

说道大数据和机器学习,就少不了Spark.本文主要介绍在Linux下搭建单机环境的Spark的步骤。安装Java SE1、下载JAVA SE linux版本。下载地址为: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html注意选择Linux版本,根据机器类型选择32位或者64位。2、

2017-05-07 14:33:56 14379 3

原创 台湾大学林轩田机器学习基石课程学习笔记7 -- The VC Dimension

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释。机器能够学习必须满足两个条...

2017-05-05 09:38:05 9346 5

原创 Python pickle模块和joblib模块浅析

在Python中,如果希望透明地存储对象,而不丢失其身份和类型等信息,则需要某种形式的对象序列化,这是一个将任意复杂的对象转成对象的文本和二进制表示的过程。同样,必须能够将对象经过序列化后的形式恢复到原来的对象。这种序列化的过程称为pickle,可以将对象pickle成字符串、磁盘上的文件或者任何类似于文件的对象;反序列化的过程就是将这些字符串、文件或任何类似于文件的对象unpickle成原来的对

2017-05-03 23:04:10 25800 2

原创 Python, CPython, Pypy, Jython的简单介绍

简单地说,Python是一门编程语言,任何一种编程语言都需要用另一种语言来实现它,比如C语言就是用机器语言来实现的。所以,Python根据实现方式不同分为了CPyhton、Pypy、Jython等。CPythonCPython是用C语言实现Pyhon,是目前应用最广泛的解释器。Python最新的语言特性都是在这个上面先实现,Linux,OS X等自带的也是这个版本,包括Anaconda里面用的也是C

2017-05-03 17:48:51 20549 1

原创 台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上一节课,我们主要探讨了当M的数值大小对机器学习的影响。如果M很大,那么就不能保证机器...

2017-05-03 14:09:03 9096 6

原创 台湾大学林轩田机器学习基石课程学习笔记5 -- Training versus Testing

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课,我们主要介绍了机器学习的可行性。首先,由NFL定理可知,机器学习貌似是不可行的...

2017-05-02 22:15:12 8846 15

原创 台湾大学林轩田机器学习基石课程学习笔记4 -- Feasibility of Learning

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课,我们主要介绍了根据不同的设定,机器学习可以分为不同的类型。其中,监督式学习中的...

2017-05-02 16:38:23 9929 24

原创 台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning

我的CSDN博客地址:红色石头的专栏 我的知乎主页:红色石头 我的微博:RedstoneWill的微博 我的GitHub:RedstoneWill的GitHub 我的微信公众号:红色石头的机器学习之路(ID:redstonewill) 欢迎大家关注我!共同学习,共同进步!上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA。PLA能够在平面中选择一...

2017-05-02 09:16:01 7750

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除