自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

转载 XGboost使用教程

5. XGBoost的参数XGBoost的作者把所有的参数分成了三类:通用参数:宏观函数控制。Booster参数:控制每一步的booster(tree/regression)。学习目标参数:控制训练目标的表现。学习目标参数:控制训练目标的表现。5.1 通用参数这些参数用来控制XGBoost的宏观功能。1、booster[默认gbtree]选择每次迭代的模型,有两种选择:gbt...

2018-11-19 16:18:46 1355

原创 《机器学习实战》之logistic回归

一、Logistic算法###恶搞如果个个日文歌减肥药

2018-10-10 19:36:13 504

原创 feedparse安装教程

学习《机器学习实战》时,需要利用RSS做数据源收集时,按照书上说的直接输入python setup.py无法安装feedparse从而无法获取到资源,上网查了之后安装方法如下:当直接利用CMD窗口输入输入python setup.py install时会报错‘python’既不是内部或者外部命令,也不是可运行的程序或批处理文件。这是因为Windows中没有Python的路径,处理办法时往里面添...

2018-09-10 21:53:31 1329

原创 《机器学习实战》基于概率论的分类方法:朴素贝叶斯

朴素贝叶斯是贝叶斯系列算法中应用最广的方法,贝叶斯方法最早由应该统计学家Thomas Bayes提出,其实简单的理解的话就是根据已经发生的某些情况来确定某事件发生的概率,而朴素贝叶斯的“朴素”指的是假设样本的所有特征都独立。核心公式理解简单了就是条件概率公式: P(A|B)=P(B|A)*PA/P(B)=P(AB)/P(B) 由于前面已经写过朴素贝叶斯...

2018-09-10 21:47:24 572

原创 机器学习实战之利用Adaboost元算法提高分类性能

Adaboost算法基本思想 Adaboost是最有代表性的boosting算法,它主要的思想就是根据上一次的分类结果自适应地调整下一次分类的权重,具体方法如下: 设上一次的分类结果错误率为:...

2018-09-10 20:46:52 595

原创 贝叶斯系列:(三)贝叶斯网络

贝叶斯网络是一种信念网,基于有向无环图来刻画属性之间的依赖关系的一种网络结构,并使用条件概率表(CPT)来描述联合概率分布。 具体来所,一个贝叶斯网络B由结构G和参数 两部分构成,B=(G, ),网络结构G是一个有向无环图,点对应每一个属性,设父节点为π,所以包含了每个属性的条件概率表为,如图所示: 结构 以结构表达了属性之间的条件独立性,给定父节点集,假设每个属性与...

2018-08-20 21:29:57 42426 10

原创 贝叶斯系列:(二)半朴素贝叶斯分类器

现实情况是属性全部独立基本上是不可能的,而如果完全考虑各属性之间的相关性会大大增加计算复杂度,所以才引入半朴素贝叶斯网络:进一步放松条件独立性假设,即假设部分属性之间存在依赖关系。 独依赖估计:每个其他属性最多只依赖于一个属性,即: 对于父属性已知的计算,可采用式(9)的计算方式进行计算。故问题就在如何确定父属性,最简单的方法是如图(b)所示,SPODE,称为超父属...

2018-08-20 21:19:47 7847 1

原创 利用python抓取ZOL手环的参数数据

因为科研需要,在做产品设计算法实例验证的时候需要大量的产品数据,但是现阶段产品数据不足导致无法做验证,因为之前有写过抓取豆瓣电影的数据,所以这篇文章和之前的大同小异,主要有以下功能: 实现了网页内部自动翻页自适应地抓取该网页上指定位置的数据,对于缺失数据的自动跳过talk is cheap, show me the code!一开始想用xpath来写,因为感觉哪...

2018-08-19 19:52:08 2186

原创 机器学习实战之决策树

    花了差不多一个星期,终于把《机器学习实战》这本书的第三章的决策树过了一遍,对于一个python渣渣来说,确实是着实不容易,好多代码都得一个一个的去查,所以整体上进度比较慢,再加上中间开了一篇关于自然语言处理和产品知识库构建的文章,导致进度及其之慢,但是总体上对代码的理解足够深刻,知道了整体决策树中ID3的一个具体编法和流程,但是得有一定决策树得基础,有兴趣得可以去看看南京大学周志华的《机器...

2018-03-09 19:36:20 14164 9

原创 利用python抓取豆瓣top500的电影

前几天突然心血来潮想写一个爬虫,所以一开始写了一个抓取时光网数据的爬虫,主要用了beautifulsoup基本命令进行数据抓取,主要代码如下(具体代码说明包含在代码内部,在此就不细说了):# -*- coding: utf-8 -*-"""Created on Thu Jan 18 14:37:37 2018@author: cxoke功能:抓取时光网top100的电影名字,导演。类

2018-01-22 23:48:28 2863

原创 贝叶斯系列:(一)朴素贝叶斯分类器

假设有N种可能的类别标记,记为:\[y=\left \{ c_{1},c_{2}...c_{N} \right \}\]现有一个样本x给定其各个属性的取值\[x_{i},i=1...d\],d为x所包含的属性的数目,若将x归为第c类的第k个属性,则有                                      \[p(c|x)=\frac{p(c)p(x|c)}{p(x)}\](...

2017-11-07 20:51:40 2072 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除