自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小卓卓的博客

格物致理 不随波逐流 不碌碌无为

  • 博客(11)
  • 收藏
  • 关注

原创 有监督学习(分类、回归)

分类与回归并无本质区别,当目标变量连续时,为回归;目标变量只能取几个离散值(类别)时,为分类。也正是由于这种不同,model estimation metric不同,分类问题常使用分类准确率(classification accuracy);而回归问题常用 Mean Absolute Error, Mean Squared Error, Root Mean Squared Error来量化模型性能。

2017-08-08 13:12:05 2664

翻译 第四章:整体建议

4.1 不要重新发明轮子4.1.1 学习Python标准库标准库中使用了大量地道的代码。写风格良好的代码的一部分是要使用丰富的标准库。标准库中不知不觉增强功能的代码是python初学者最清晰的指引。Python被公认为是一种拿来即可用的语言,标准库包含大量覆盖了很多领域的包。使用标准库有两个主要好处。最明显的,可以节省大量的时间,因为你不必从零开始实现一项功能。还有一个是同样重要的,如果你与阅读或者

2017-06-29 11:22:45 394

翻译 第三章:组织你的代码

3.1 模块和包3.1.1 使用模块进行封装而不是像其它语言一样使用对象虽然Python支持面向对象编程,但这不是必须的。很多有经验的Python程序员相对较少的使用类和多态机制。主要有几个原因:类中大部分数据用列表,字典,和集合存储。Python有更多种类的内建函数和标准库模块对数据交互做了很多优化。一个令人信服的理由,只有在需要的时候类才被使用,几乎不会在API的边界。在Java中类是基本的封装

2017-06-29 07:29:25 383

翻译 第二章:处理数据

2.1 列表2.1.1 使用列表推导式将一个已经存在的列表转化为一个新的列表利用已存在的数据创建新的列表时,合理使用列表推导式将增加代码的清晰度,尤其需要对迭代器中元素进行判断和转换时,这一点体现的更为明显。 由于cPython解释器的优化,使用列表表达式(或者生成式表达式)将提高程序的性能。 2.1.1.1 糟糕的写法some_other_list = range(10)some_list

2017-06-28 13:09:22 428

翻译 第一章:控制结构和函数

1.1If 语句1.1.1避免直接和True,False,None进行比较对于任何一个对象,无论是内建的还是用户自定义的,都有一个与其相关联的“真”。当检查一个条件是否为真时,在条件语句中优先使用对象隐含的“真”。视为真的规则是显而易见的。以下是视为False的情况:NoneFalse数值类型的0空序列空字典调用len或者nonzero返回0或者False时其余所有情况皆为True(而

2017-06-27 12:37:52 358

翻译 前言

关于编写可维护的软件有一个流传已久的著名语录: 写代码的时候时刻想着后续维护你代码的是一个暴力的神经病患者,而且他还知道你住在哪里。

2017-06-21 07:04:24 471

原创 SVM

SVM(Support Vector Machine)是用来解决分类问题的。任何一个机器学习问题首先要解决三个问题:模型是什么优化目标是什么算法是什么 SVM的模型如下:一个针对二元分类问题的线性分类器

2017-06-04 15:40:56 854

原创 由矩阵转置引发的一系列思考(线性代数的核心)

在MATHEMATICS看到一个问题“矩阵转置的直观理解是什么?”最初只是想怎么更好的回答这个问题,顺带多写了一点,就有了这篇文章。矩阵Am×n\mathop {\rm{A}}\nolimits_{m \times n} 把Rn\mathop R\nolimits^n 空间的向量映射到Rm\mathop R\nolimits^m 空间,ATn×m\mathop {\mathop A\nolimits

2017-05-14 15:06:06 2171 4

原创 排序(上):基于比较的排序

排序是基础且重要的问题,排序算法有几十种,可以证明,有些算法是渐进最优的。那为什么还会存在一些不那么快的算法呢?快慢是从时间尺度来衡量的,空间呢?那些运行很快的排序算法,需要多大的空间呢?排序是不是稳定的呢?如果不是,转化为稳定的排序,又需要多少额外的时间和空间呢?每种算法各有千秋,不存在任何方面都最优的算法,只有限定条件下的最优解,而这也正是我们努力想要求得的。什么是排序:输入:长度为n的序列

2017-05-04 23:32:12 3912

原创 子字符串查找(上):从暴力算法到KMP

子字符串查找(串匹配)很常用,当你在文本编辑器中使用搜索功能定位某个单词,或者在浏览器中输入一个关键字搜索网页,你可能从未意识到此时你正面临的就是子字符串查找问题。你得到了想要的结果,而这背后起作用的就是某一个子字符串查找算法。问题描述: 文本T = Life becomes a lot more fun when you know that it is meaningless 模式P = fu

2017-04-26 11:46:25 659

原创 算法中的数学

一直想写点东西,对各个知识块做一个梳理、总结,只是因为太懒,迟迟没有动笔。我很喜欢算法,而且我的编程之路是从MIT《算法导论》开始的,所以就从算法写起吧。

2017-04-18 13:14:01 1215 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除