自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【支持向量机SVM】常见面试题

核函数:样本在原始空间中通过核函数K计算后的结果 = 样本映射到高维特征空间后的内积当样本在原始空间中线性不可分时,我们就要将其映射到高维空间中,使它线性可分。由于核函数的存在,不需要知道具体的映射函数,就可以求解出对偶问题的结果。使数据从原始低维空间映射到高维空间,从线性不可分变为线性可分。在求解负有问题时,不需要知道具体的映射函数,只要知道核函数就行,使得求解的难度和算力大大降低。SMO算法是用来求解SVM模型的对偶问题的。

2023-01-01 19:32:20 356

原创 【朴素贝叶斯】

朴素贝叶斯 = 贝叶斯定理 + 独立假设一句话概括:朴素贝叶斯是基于,的分类算法,它以特征之间相互独立作为前提,学习输入和输出的,再基于学习到的模型,求出使得最大的输出。一个个来解释加粗的概念。假设有样本数据D =, 这些样本具有n个特征F =, 一共有m个类 C =。假设其中n个特征相互独立且随机,则联合概率为P(C, F), C的先验概率为P(C),C的后验概率为P(C|F).其中:。所以对于该样本数据,:朴素贝叶斯是基于的假设,这也是朴素贝叶斯为什么“朴素”的原因。

2022-12-31 17:17:37 2395

转载 【xgboost】常见面试题

最近在准备秋招,所以先将一些问题理一遍。

2022-10-16 20:14:57 636

原创 Python数据结构之【列表】

Python有四种数据结构,分别是列表,元组,集合和字典,这里先说字典。python的列表和java的一维数组有点类似,不过列表可以存储不同数据类型的元素,包括四种数据结构。列表使用索引index来进行元素的访问,这点和java的数组相似。列表在修改元素时,都是在列表本身上进行修改,包括添加元素、删除元素和修改元素。列表添加元素的操作有append, extend 和Insert,都没有返回值,使用的时候各有区别,具体例子如下:删除元素同样是在列表本身上进行修改,所以没有返回值,pop()方法虽然有返回值,

2022-06-16 05:56:22 104

原创 【NLP学习笔记】Word Normalization and Stemming

此专栏记录NLP的学习,入门教程为油管上Dan Jurafsky的NLP教学视频。 在NLP中一个常见的问题是,由于英语自身的特点,一个单词有不同的形式,不同时态,单复数,缩写等等,我们通常需要做一些工作将这些单词转换成其最简单的形式。目录Normalization对称扩展Case foldingLemmationMorphemesStemming 词干提取Porter‘s 算法 在信息检索时,检索的文本和文本库里的词形式不一样,比如U.S.A和USA,我们通常希望想办法把它俩匹

2022-06-15 04:20:38 268

原创 【NLP 学习笔记】Regular Expressions 正则表达式

在预处理文本的时候,常常出现一些问题,例如首字母大小写,单复数形式等等,解决这个问题的一个方法就是Regular Expressions,即正则表达式。解决这些问题本质上是在解决两种错误:

2022-06-14 07:21:27 246

原创 Python 基本数据结构之【元组】

python元组的特点、添加元素、索引等操作。

2022-06-14 06:06:24 123

原创 【逻辑回归】常见面试题

逻辑回归是一个二分类算法,假设特征和结果存在线性映射关系,存在一个目标函数使得输入一个样本后得到对应的概率,再通过sigmoid函数根据设定的阈值分成两类。可以简单认为是线性回归+sigmoid函数。基本假设:输出的类别服从伯努利二项分布。正则化:在损失函数后加上惩罚项,对某些参数作一些限制 参考:L1正则化方法(lasso)和L2(ridge)正则化方法的区别_wangyanao520的博客-CSDN博客_对于线性回归模型l2正则化方法是指https://blog.csdn.net/a135

2022-06-13 21:27:41 507

原创 【随机森林】原理,优缺点和应用场景

随机森林是以决策树作为基学习器的集成模型,特点是低方差低偏差,分成两部分,随机和森林。原理/步骤:优点:缺点:应用场景:既可以用于分类也可以用于回归问题,不适用于需要高实时的场景。...

2022-06-04 01:47:52 4631

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除