机器学习
文章平均质量分 79
机器学习
胡桃夹子zy
这个作者很懒,什么都没留下…
展开
-
支持向量机SVM基础理解
定义支持向量机是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器;支持向量机还包括核技巧,使它成为实质上的非线性分类器。支持向量机学习策略是间隔最大化,形式化为一个求解凸二次规划的问题。间隔与支持向量先来看看下面这一组数据的分布,这是一组两种标签的数据,两种标签分别由圆和方块代表。支持向量机的分类方法,是在这组分布中找出一个超平面作为决策边界,将不同类别分开,但能将样本...原创 2020-05-01 22:19:58 · 521 阅读 · 0 评论 -
机器学习-贝叶斯
1. 基本概念先验概率事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。一般都是单独事件概率,如P(A),P(B)。条件概率一个事件发生后另一个事件发生的概率。一般的形式为P(A|B)表示B发生的条件下A发生的概率。后验概率事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,即执果求因。西瓜举例:先验概率,就是常识、...原创 2020-04-23 22:40:50 · 359 阅读 · 0 评论 -
机器学习-线性回归
目录:1.多元线性回归2.Ridge岭回归3.Lasso回归4.Logistic逻辑回归1.线性回归原创 2020-04-21 22:03:07 · 249 阅读 · 0 评论 -
卡方分箱及代码实现
# 1.卡方分布原创 2020-04-12 22:59:23 · 4947 阅读 · 4 评论 -
模型融合
模型融合是将多种调参完成的模型进行融合 。融合的几种方式简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting/bagging(在x...原创 2020-04-04 21:17:50 · 266 阅读 · 0 评论 -
建模调参
xgboost原创 2020-04-01 21:48:16 · 209 阅读 · 0 评论 -
机器学习-决策树
决策树1. 决策树算法核心解决的2个问题1.1 如何选择最优划分的属性使用不纯度划分。衡量纯度可以分信息熵和基尼值。1.1.1 信息熵信息熵(information entropy)是度量不纯度最常用指标。不纯度计算是基于节点来结算,树中的每个节点都会有不纯度。1.1 假设当前节点t中第k类样本所含比例为pkp_kpk,则信息熵定义为:Ent(t)=−∑k=1cpklog2pkE...原创 2020-03-29 11:07:06 · 207 阅读 · 0 评论