自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

蜗牛先生的学习笔记

用简明易懂的方式学习

  • 博客(11)
  • 收藏
  • 关注

原创 【机器学习基础算法系列】【贰】全面详解支持向量机SVM(Support Vector Machine)

文章目录算法流程拉格朗日对偶问题推导软间隔kernel序列最小最优化算法SMO算法流程支持向量机由简单到复杂有多种模型:线性可分的支持向量机,线性支持向量机,非线性支持向量机。其中线性可分的支持向量机又称之为硬间隔支持向量机;近似线性支持向量机又称之为软间隔支持向量机;非线性支持向量机是一种使用kernel核技巧即软间隔的支持向量机。本章节的流程是线性可分的支持向量机,在本章节内都简称为支持...

2019-12-27 14:07:23 209

原创 【机器学习基础算法系列】【伍】全面详解Xgboost

文章目录算法流程Shrinkage and Column Subsampling近似算法针对稀疏数据的算法(缺失值处理)算法优点算法流程定义目标函数xgboost本身就是一种树的boosting方式,同GBDT一样采用前相加法训练的方式进行残差的迭代,最终将叶子节点的值相加即得到最终过的输出。因此XGB的输出y^=∑k=1Kfk(x)\hat y=\sum_{k=1}^Kf_k(x)...

2019-12-26 11:29:35 310

原创 【机器学习基础算法系列】【肆】全面详解GBDT(Gradient Boosting Decision Tree)

文章目录算法流程常见问题算法流程回归树的生成【参考李航书,CART决策树算法浅谈(回归树部分)讲的也比较好】:1)穷举扫描每一个属性特征及其取值,选取使均方误差最小的特征进行分枝;2)根据划分到两个分枝的数据子集对应的y的平均值获得c1和c2,分别计算两个数据子集的平均绝对误差,选取可以使均方误差最小的特征和取值对作为节点,并确定子节点处的预测值为对应的c1和c2;3)对子节点重复...

2019-12-26 11:26:33 279

原创 【机器学习基础算法系列】【叁】全面详解决策树(Decision Tree)

文章目录符号定义增益计算树的生成树的剪枝符号定义DDD为训练数据集,∣D∣|D|∣D∣为训练数据集样本个数CCC为样本所属类别,CkC_kCk​表示样本所属为第kkk类,∣Ck∣|C_k|∣Ck​∣表示所属第kkk类的样本数,∑k=1K∣Ck∣=∣D∣\sum_{k=1}^K|C_k|=|D|∑k=1K​∣Ck​∣=∣D∣AAA为特征集,AkA_kAk​表示第kkk个特征,$a_i\in...

2019-12-26 11:24:34 201

原创 【机器学习基础算法系列】【壹】全面详解逻辑回归LR(Logistics Regression)

文章目录算法流程正则化LR使用Sigmoid函数的原因LR的输出是否为真实的概率算法流程逻辑回归(Logistics Regression)虽然名为回归,但大部分的场景都用来做分类任务,其与线性回归等一系列回归任务仅存在因变量分布的区别,这点会在【广义线性模型】章节详述。回归问题的常规步骤构造假设预测函数(hypothesis)构造损失函数(loss)寻找损失函数最小优化算法(op...

2019-12-26 11:19:16 477

原创 【机器学习基础算法系列】【零】学习ML基础算法看这个系列就够了

本系列全面、详细、清晰的介绍机器学习常用算法。包括算法流程、算法推导、常见问题与解答等。学习ML基础算法,关注这一系列就够了。

2019-12-26 11:13:19 117

原创 Linux下使用rsync在多台服务器间只针对特定类型的文件进行同步备份

Linux下使用rsync在多台服务器间只针对特定类型的文件进行同步备份rsync的简单使用语法常用参数在多台服务器间同步文件无密码同步在源服务器生成ssh秘钥发送公钥到目标服务器测试无密码ssh只针对特定类型的文件进行同步rsync的简单使用rsync命令是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。rsync使本地和远程两个主机之间的文件达到同步,这个算法只传送两个...

2018-12-03 15:45:05 1070

原创 Windows下在python 2.7中安装fasttext

1. 环境信息OS:windows764bitPython:2.7.14 [MSCv.1500 64 bit (AMD64)]2. 安装过程2.1 安装1、安装方法有很多,可以直接pip install fasttext也可以先clone源码git clone https://github.com/facebookresearch/fastText.git2、然后cd ./fastTextpip...

2018-07-16 14:42:32 2259 3

原创 Ubuntu 16.04 安装Hadoop

一、安装java1.下载java在http://www.oracle.com/technetwork/cn/java/javase/downloads/获取最新版java。本文中下载的是Java SE Development Kit9.0.4。2.切换到root用户因为之后会有很多操作涉及到权限,直接使用root用户方便$ su [Enter]输入root密码 3.解压安装包在安装目录下解压下载的...

2018-02-12 20:53:43 615

原创 C++ 常用容器系列【零】:总篇

什么是容器?C++的标准模板库(STL)提供给开发者很多便利的功能,比如容器、迭代器、函数对象和一些常用算法等。容器是一个可以存储数据的模板类,类似数组一样。那为什么要使用容器呢?我们知道,很多时候使用数组在处理很多问题时比较繁琐,常用操作复用率太低,同样的数组操作每次都要重复写的话工作量太大。因此STL封装了很多功能函数在容器中,这为我们存储数据、操作数据都提供了诸多便利。因此用容器类可以提高编码的效率和整洁性。

2017-04-03 16:36:33 282

原创 C++ 常用容器系列【一】:string的用法总结

What?首先我们先说什么是string,string是C++标准库的一个重要的部分,主要用于字符串处理。可以使用输入输出流方式直接进行操作,也可以通过文件等手段进行操作。简而言之就是操作字符串的。Why?我们都知道C和C++都有char类型来操作字符串,那我们为什么要使用string呢?原因很简单:因为string类型封装了许多非常好用的函数在其中,很多功能用char类型要写十几行甚至几十行的功能,用string类型的函数也许一行就搞定了,使用起来非常的简洁方便,让你的代码更加优雅。

2017-03-30 22:40:38 357

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除