Python爬虫入门三之Urllib库的基本使用

1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以...

2017-05-31 14:50:55

阅读数:228

评论数:0

Python JSON模块

(一)什么是json: JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition...

2017-05-31 14:48:43

阅读数:124

评论数:0

Python Pandas与Numpy中axis参数的二义性

Stackoverflow.com是程序员的好去处,本公众号将以pandas为主题,开始一个系列,争取做到每周一篇,翻译并帮助pandas学习者一起理解一些有代表性的案例。今天的主题就是Pandas与Numpy中一个非常重要的参数:axis.(轴) Stackoverflow问题如下: ...

2017-05-26 17:13:06

阅读数:488

评论数:0

机器学习之正则化(Regularization)

1. The Problem of Overfitting 1 还是来看预测房价的这个例子,我们先对该数据做线性回归,也就是左边第一张图。 如果这么做,我们可以获得拟合数据的这样一条直线,但是,实际上这并不是一个很好的模型。我们看看这些数据,很明显,随着房子面积增大,住房...

2017-05-26 14:35:46

阅读数:190

评论数:0

核函数

http://crsouza.com/2010/03/17/kernel-functions-for-machine-learning-applications/ In recent years, Kernel methods have received major attention,...

2017-05-25 20:27:38

阅读数:543

评论数:0

线性判别分析(Linear Discriminant Analysis)(二)

4. 实例       将3维空间上的球体样本点投影到二维上,W1相比W2能够获得更好的分离效果。              PCA与LDA的降维对比:              PCA选择样本点投影具有最大方差的方向,LDA选择分类性能最好的方向。      ...

2017-05-25 19:02:16

阅读数:216

评论数:0

线性判别分析(Linear Discriminant Analysis)(一)

http://www.cnblogs.com/jerrylead/archive/2011/04/21/2024384.html 1. 问题      之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。回想我们做回归时,如果特征太多,那么会产生不相关特征引入...

2017-05-25 19:00:10

阅读数:215

评论数:0

A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)

本文是对 http://mnemstudio.org/path-finding-q-learning-tutorial.htm 的翻译,共分两部分,第一部分为中文翻译,第二部分为英文原文。翻译时为方便读者理解,有些地方采用了意译的方式,此外,原文中有几处笔误,在翻译时已进行了更正。这篇教程通俗易懂...

2017-05-25 15:27:11

阅读数:166

评论数:0

偏最小二乘法回归(Partial Least Squares Regression)

[pdf版本]偏最小二乘法回归.pdf 1. 问题      这节我们请出最后的有关成分分析和回归的神器PLSR。PLSR感觉已经把成分分析和回归发挥到极致了,下面主要介绍其思想而非完整的教程。让我们回顾一下最早的Linear Regression的缺点:如果样例数m相比特征数n少(m...

2017-05-25 14:48:05

阅读数:402

评论数:0

典型关联分析(Canonical Correlation Analysis)

典型关联分析(Canonical Correlation Analysis) [pdf版本] 典型相关分析.pdf 1. 问题       在线性回归中,我们使用直线来拟合样本点,寻找n维特征向量X和输出结果(或者叫做label)Y之间的线性关系。其中,。然而当Y也是多维时,或者说Y也有多个特...

2017-05-25 12:08:41

阅读数:194

评论数:0

增强学习(Reinforcement Learning and Control)

http://www.cnblogs.com/jerrylead/archive/2011/05/13/2045309.html  [pdf版本]增强学习.pdf      在之前的讨论中,我们总是给定一个样本x,然后给或者不给label y。之后对样本进行拟合、分类、...

2017-05-25 12:07:28

阅读数:634

评论数:0

Cost Sensitive Learning

http://www.svcl.ucsd.edu/projects/CostLearning/ Cost Sensitive Learning Cost Sensitive Learning Classification problems ...

2017-05-24 18:29:34

阅读数:1544

评论数:0

不平衡数据分类算法介绍与比较

https://arxiv.org/abs/1608.06048 介绍 在数据挖掘中,经常会存在不平衡数据的分类问题,比如在异常监控预测中,由于异常就大多数情况下都不会出现,因此想要达到良好的识别效果普通的分类算法还远远不够,这里介绍几种处理不平衡数据的常用方法及对比。 ...

2017-05-24 18:21:22

阅读数:578

评论数:0

增强学习(二)----- 马尔可夫决策过程Markov Decision

1. 马尔可夫模型的几类子模型 我想大家一定听说过马尔科夫链(Markov Chain), 搞机器学习的也都知 道隐马尔可夫模型(Hidden Markov Model,HMM)。它们具有的一个共同性质就是马尔可夫性(无后效性),也就是指系统的下个状态只与当前状态信息有关,而与更早之前的状态...

2017-05-23 13:28:25

阅读数:873

评论数:0

隐马尔科夫模型HMM学习最佳范例

隐马尔科夫模型HMM学习最佳范例 公开 2012-10-24 19:33 | (分类:Bioinformatics) 谷歌路过这个专门介绍HMM及其相关算法的主页:http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_...

2017-05-23 13:07:03

阅读数:908

评论数:0

SVM多类分类方法

SVM多类分类方法的实现根据其指导思想大致有两种: (1)将多类问题分解为一系列SVM可直接求解的两类问题,基于这一系列SVM求解结果得出最终判别结果。 (2)通过对前面所述支持向量分类机中的原始最优化问题的适当改变,使得它能同时计算出所有多类分类决策函数,从而“一次性”地实现多类分类...

2017-05-23 11:56:17

阅读数:306

评论数:0

SVM实现多分类的三种方案

SVM本身是一个二值分类器   SVM算法最初是为二值分类问题设计的,当处理多类问题时,就需要构造合适的多类分类器。   目前,构造SVM多类分类器的方法主要有两类   (1)直接法,直接在目标函数上进行修改,将多个分类面的参数求解合并到一个最优化问题中,通过求解该最优化问题“一...

2017-05-23 11:54:53

阅读数:1496

评论数:0

Active Learning

阅读目录 1. 写在前面 2. 什么是active learning? 3. active learning的基本思想 4. active learning与半监督学习的不同 5. 参考文献 回到顶部 1. 写在前面   在机器学习(Machine lear...

2017-05-23 11:53:38

阅读数:358

评论数:0

总结:Bootstrap(自助法),Bagging,Boosting(提升)

前言 最近在理清一些很必要的也很基础的东西,记录一下,结合网上和文献,自己也有些易化使之更轻松理解,如有错误,请不吝赐教,多谢! Bootstrap(自助法) Bootstrap是一种抽样方法 核心思想 这里写图片描述 子样本之于...

2017-05-23 11:41:12

阅读数:501

评论数:0

机器学习经典算法详解及Python实现--元算法、AdaBoost

版权声明:本文为博主原创文章,未经博主允许不得转载--“http://blog.csdn.net/suipingsp”。 目录(?)[+] 第一节,元算法略述 遇到罕见病例时,医院会组织专家团进行临床会诊共同分析病例以判定结果。如同专家团临床会诊一样,重大决定...

2017-05-23 11:11:09

阅读数:403

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭