自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 集成算法Boosting之 ---- XGBoost

1. XGBoost简介XGBoost: eXtreme Gradient Boosting 创造者:陈天奇博士 http://homes.cs.washington.edu/~tqchen/ 原论文地址:https://arxiv.org/pdf/1603.02754.pdf 项目地址:https://github.com/dmlc/xgboost PPT地址:https://hom...

2018-09-17 11:09:28 346

原创 泰勒展开式

泰勒公式通过把任意函数表达式转换(重写)为多项式形式,是一种极其强大的函数近似工具。公式:f(x)Taylor=∑n=0∞fn(a)n!∗(x−a)nf(x)_{Taylor}=\sum_{n=0}^{\infin}{\frac{f^n(a)}{n!}*(x-a)^n}f(x)Taylor​=n=0∑∞​n!fn(a)​∗(x−a)n=f(a)+f′(a)1!(x−a)+f(2)(a)2!(...

2020-03-03 22:45:37 1244

原创 决策树

模型用决策树分类,从根节点开始,对实例的某一特征进行测试,根据测试结果,将实例分配到其子节点。我们需要的是一个与训练数据矛盾较小的决策树,同时具有很好的泛化能力。递归地选择最优特征:开始,构建根节点,选择一个最优特征。按照这一特征将训练数据集分割成子集,使得各个子集有一个在当前条件下最好的分类。不断构建叶节点和新的最优特征,对其进行分割。直至所有训练数据子集被基本正确分类,或者没有合适的特...

2020-03-03 11:06:41 314

原创 朴素贝叶斯法

简介朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法,属于生成模型。模型设输入空间X∈RnX\in{R}^nX∈Rn,输出空间为类别标记集合Y={c1,c2,...,ck}Y=\{c_1, c_2,...,c_k\}Y={c1​,c2​,...,ck​}。X是定义在输入空间上的随机变量,Y是定义在输出空间上的随机变量。P(X,Y)P(X,Y)P(X,Y)是X和Y的联合概率分布。训练...

2020-03-01 13:10:31 194

原创 K近邻法

简介给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。模型模型由三个基本要素:距离度量、k值的选择、分类决策规则决定。距离度量:k近邻模型的特征空间是n维实数向量空间RNR^NRN,使用的距离是欧式距离,但也可以是更一般的LpL_pLp​距离或Minkowski距离。xi,xj∈RNx_i, x_j\...

2020-02-29 19:52:48 193

原创 范数

什么是范数?范数,是具有 “长度” 概念的函数。在线性代数、泛函分析及相关的数学领域,范数是一个函数,是矢量空间内的所有矢量赋予非零的正长度或大小。在数学上,范数包括向量范数和矩阵范数。向量范数表征向量空间中向量的大小,矩阵范数表征矩阵引起变化的大小。 一种非严密的解释就是,对应向量范数,向量空间中的向量都是有大小的,这个大小如何度量,就是用范数来度量的,不同的范数都可以来度量这个大小,就好...

2020-02-28 21:40:34 632

原创 感知机

简介感知机是二分类的线性分类模型,在特征空间中将实例划分为正负两类的分离超平面,属于判别式模型。模型假设输入空间是x⊆Rx\subseteq Rx⊆R,输出空间是Y={−1,+1}Y=\lbrace-1,+1\rbraceY={−1,+1}。由输入空间到输出空间的如下函数:f(x)=sign(wx+b)f(x)=sign(wx+b)f(x)=sign(wx+b)sign(x)=1,x&g...

2020-02-23 12:03:35 92

原创 Oracle+PLSQL安装配置

Oracle+PLSQL安装配置在本机安装Oracle客户端的时候遇到了一些问题,已顺利解决,写出来分享一下。主要包括:配置环境变量PLSQL可以登录数据库进行后续操作,但是代码/程序却无法连接数据库下载软件可以在官网上下载Oracle客户端和PLSQL软件,下载网址:https://www.oracle.com/database/technologies/112010-win32s...

2019-12-17 18:10:21 378

原创 斯坦福NER模型训练

coreNLP是斯坦福大学开发的关于自然语言处理的工具,包含了命名实体识别、词性标注、分词器等等功能,功能强大使用方便。可以在官网上下载coreNLP系列文件:https://stanfordnlp.github.io/CoreNLP/index.html#download并在本地进行安装,注意需要首先安装java。可以在网上搜索相关安装教程,本文重点是介绍如何通过stanford NER C...

2019-06-06 18:36:37 2223 1

高基数类别特征的数据预处理

论文

2018-09-19 16:12:27 3519 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除