自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 SVM

学习内容SVM 硬间隔原理SVM 软间隔SMO 求解SVM代码设计1、硬间隔SVM-统计学习基础一开始讲解了最小间距超平面:所有样本到平面的距离最小。而距离度量有了函数间隔和几何间隔,函数间隔与法向量www和bbb有关,www变为2w2w2w则函数间距变大了,于是提出了几何距离,就是对www处理,除以∣∣w∣∣||w||∣∣w∣∣,除以向量长度,从而让几何距离不受影响。但是支持...

2020-05-01 22:03:27 186

原创 CRF

CRF是一个序列化标注算法,接收一个输入序列如X=(x1,x2,...,xn)X=(x_1,x_2,...,x_n)X=(x1​,x2​,...,xn​)并且输出目标序列Y=(y1,y2,...,y3)Y=(y_1,y_2,...,y_3)Y=(y1​,y2​,...,y3​),这里使用大写 X,Y 表示序列。例如,在词性标注任务中,输入序列为一串单词,输出序列就是相应的词性。除了词性标注之外,...

2020-04-28 22:46:51 212

原创 EM

前言EM算法是机器学习十大算法之一,它很简单,但是也同样很有深度,简单是因为它就分两步求解问题,E步:求期望(expectation)M步:求极大(maximization)深度在于它的数学推理涉及到比较繁杂的概率公式等,所以本文会介绍很多概率方面的知识,不懂的同学可以先去了解一些知识,当然本文也会尽可能的讲解清楚这些知识,讲的不好的地方麻烦大家评论指出,后续不断改进完善。EM算法引...

2020-04-25 23:46:27 176

原创 线性回归

线性回归线性回归的概念线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为f(x)=θ0+θ1x1+θ2x2+...+θdxd=∑i=0dθixif(x) = \theta_0 + \theta_1x_1 + \theta_2x_2 + ... + \theta_dx_d \\ = \sum_{i=0}^{d}\th...

2020-04-21 11:51:13 244

原创 模型融合

文章目录模型融合Stacking相关理论介绍代码示例回归\分类概率-融合:1. 简单加权平均,结果直接融合2. Stacking融合(回归):分类模型融合1. Voting投票机制:2. 分类的Stacking\Blending融合3. 分类的Stacking融合(利用mlxtend)赛题示例1. 导入数据及定义方法2. XGBoost的五折交叉回归验证实现3. 划分数据集,并用多种方法训练和预测...

2020-04-04 20:41:39 956

原创 建模调参

文章目录建模与调参几种模型线性回归模型建模与调参几种模型线性回归模型线性回归最普通的形式是其中x向量代表一条样本{x1,x2,x3…xn},其中x1,x2,x3代表样本的各个特征,w是一条向量,代表了每个特征所占的权重,b是一个标量代表特征都为0时的预测值,这里的w乘以x在线性代数中其实代表的是两个向量的内积。...

2020-04-01 21:10:32 234

原创 特征工程

文章目录特征工程什么是特征工程特征构建特征提取、特征选择常见的特征工程实战演练导入数据删除异常值特征工程什么是特征工程“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征工程在机器学习中占有非常重要的作用,一般认为括特征构...

2020-03-28 19:49:36 201

原创 数据的探索性分析(EDA)

探索性数据分析(EDA)文章目录探索性数据分析(EDA)什么叫探索性数据分析探索性分析的步骤实战案例什么叫探索性数据分析探索性数据分析(Exploratory Data Analysis,简称EDA),摘抄网上的一个中文解释,是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。当我们...

2020-03-24 17:02:42 1313

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除