自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

九久的博客

一位不正经计算机系学生的博客

  • 博客(10)
  • 资源 (3)
  • 问答 (2)
  • 收藏
  • 关注

原创 线性svm缺点以及解决办法的讨论

线性SVM缺点:线性SVM是做不到的,实际上的决策边界:怎么解决非线性模型:1、利用非线性模型-----神经网络2、把数据映射到高纬度的空间,在高纬度空间中学习一个线性模型数据映射到高维空间方法:将特征做加减乘除平方等方法获得更多的特征但是这种方法需要耗费大量时间:1、转化为高纬度模型2、高维度空间建立模型解决办法:kernel tack...

2021-02-28 17:14:30 397

原创 线性分类器

线性回归:线性分类器介绍:线性分类器图片如下图所示,有两堆数据,绿色和红色,以及有三条线将它们分开,我们需要从这三条线中选择一条线,那么选择哪一条线?这三条线准确率都是100%,那么选择哪条线?如果选择第一条线,那么如果数据有点杂音的话就不在那么准确,而且也能看出来1有点过拟合,3同理,所以我们选择第二条线。接下来解释为什么选择第二条线:从下图可以看出,我们以第二条线向这两对数据做平行线,即途中绿色虚线我们定义margin为这两条绿色线的距离,距离越大那么我们区分这两对数据的准确是不是也也越大

2021-02-28 11:10:48 222

原创 梯度下降算法的复杂度

与其它一般的算法并不一样,因为梯度下降是迭代算法,也跟初始化的值有关系,也跟步长有关。那么是否能比较各个算法之间的复杂度呢?直观方法:每个方法都跑一下。核心:需要多少次迭代?方法:收敛分析...

2021-02-27 22:56:23 1976

原创 优化以及实例

AI问题 = 模型+优化优化是使用一些工具进行解决(SGD、Adm等各种算法进行优化),那么怎么选择优化算法?将得到的模型和问题,能够明确知道属于哪些问题,从而选择正确的方法。并不是使用算法就好了,也要加一些东西:比如正则化。objective function 目标函数,由目标函数分类,选择相应的优化算法全局最优解和局部最优解,如果是凸函数,那么找到的姐是全局最优解,如果不是凸函数找到的是局部最优解,此时想方设法得到最好的局部最优解。non-convex问题很难解决,解决办法:改变数学公式得到

2021-02-27 15:04:26 222 1

原创 回归

回归:当我们拿到的样本数据中,数据大部分是向量,标记可能是连续可能是离散。当标记为连续的时候,我们做回归,如果是离散的,那么做分类。

2021-02-26 19:31:20 88

原创 数据清洗

脏数据就是再物理上存在过,但是逻辑上并不存在的数据。数据清洗是整个数据分析过程的第一步,就像做一道菜之前需要先择菜洗菜一样。数据预处理方法:1、部署环境,导入分析包和数据import pandas as pdimport numpy as npfileNameStr = '文件名'DataDF = pd.read_csv()2、尝试去理解这份数据我们可以通过对数据集提问来判断这份数据能不能满足解答我们的问题,数据是否干净需不需要进一步处理,问题包括但不限于:数据集多少数据?包含

2021-02-25 21:52:20 209

原创 NLP基础介绍

What is NLP?NLP = NLU + NLGNLU:语言、文本——>意思NLG:意思——>语音文本解决问题:一词多义。怎么解决:如果没有语境,只能通过词语使用概率进行猜测;有语境就加上 上下文 即与该词有关的信息。例如:机器翻译。原始:每个单词对照翻译改进:先进行大概翻译,再从各个可能的翻译中选取概率最大的翻译。缺点:时间复杂度很高。语言模型:给定一句英文e,计算概率(e),如果是符合英文语法的p(e)会高,如果是随机语句,p(e)会低翻译模型:给定一对<c,

2021-02-24 20:56:13 264

原创 分类算法-逻辑回归

线性分类的式子作为逻辑回归的输入,再回归的时候完成分类,同时也有概率值。用于:广告点击率、判断用户性别、预测用户是够会购买给定的商品类、判断一条评论是正面还是负面。逻辑回归是解决二分类问题的。逻辑回归公式:输出:[0,1]区间g(z)为sigmoid函数sigmoid函数图:损失函数、优化与线性回归原理相同,但由于是分类问题, 损失函数不一样,只能通过梯度下降求解。对数似然损失函数:完整的损失函数:cost损失的值越小,那么预测的类别准确度更高..

2021-02-23 20:34:41 94

原创 分类算法的评估

准确率精确率召回率模型调参数交叉验证网格搜索

2021-02-23 11:36:52 142

原创 决策树

1、认识决策树决策树是分类算法中的一种,其思想很朴素,就是程序设计里面的if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。2、决策树优缺点以及改进优点: 简单的理解和解释,树木可视化。 需要很少的数据准备,其他技术通常需要数据归一化。缺点: 决策树学习者可以创建不能很好地推广数据的过于复杂的树,这被称为过拟合。决策树可能不稳定,因为数据的小变化可能会导致完全不同的树被生成改进: 减枝cart算法 随机森林...

2021-02-17 20:27:13 138

fsl缺少文件.rar

适用于使用eddy tbss 等工具却发现fsl报错无相关的文件。将里面的文件放在/安装fsl目录/fsl/bin下即可

2021-06-14

shell_final.zip

本代码中包含shell中一些命令的实现,各个命令由一个主函数进行连接,没有写shell界面,直接用ubuntu的c++编辑器即可运行。

2020-04-12

codeblocks 13:12

压缩文件,将文件解压后点击install应用程序,然后一直点击next直到finish。codeblocks就好了。

2018-05-01

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除