qq_38056367-CSDN博客

原创 Attention

Attention对比RNN和CNN，分别有哪点你觉得的优势？对比RNN的是，RNN是基于马尔可夫决策过程，决策链路太短，且单向对比CNN的是，CNN基于的是窗口式捕捉，没有受限于窗口大小，局部信息获取，且无序写出Attention的公式？解释你怎么理解Attention的公式的？Q:,K:,V:首先，我们可以理解为Attention把input重新进行了一轮编码，获得一个新的序列除以的目的是为了平衡qk的值，避免softmax之后过小qk除了点击还可以直接拼接再内接一个参数

2020-09-25 15:33:15 594

原创支持向量机

简单介绍SVM?从分类平面，到求两类间的最大间隔，到转化为求间隔分之一等优化问题：loss=min(1/2·||W||·||W||) subject to：y(wx+b)>=1，其中||·||为2范数然后就是优化问题的解决办法，首先是用拉格拉日乘子把约束优化转化为无约束优化，对各个变量求导令其为零，得到的式子带入拉格朗日式子从而转化为对偶问题最后再利用SMO（序列最小优化）来解决这个对偶问题什么叫最优超平面？两类样本分别分割在该超平面的两侧超平面两侧的点离超平面尽可能的远什么是

2020-09-25 15:27:24 279

原创线性回归

损失函数是啥mse,最小均方误差:最小二乘/梯度下降手推最小二乘损失函数：求导可得：使右侧为0可得：如果X点乘X的转置可逆则有唯一解，否则无法如此求解梯度下降损失函数：求导可得梯度：介绍一下岭回归加上l2的线性回归：在用最小二乘推导的过程和上面一样，最后在结果上进行了平滑，保证有解：什么时候使用岭回归？样本数少，或者样本重复程度高什么时候用Lasso回归？特征过多，稀疏线性关系，目的为了在一堆特征里面找出主要的特征...

2020-09-25 15:26:50 192

原创随机森林

解释下随机森林?随机森林=bagging+决策树随机：特征选择随机+数据采样随机特征随机是在决策树每个结点上选择的时候随机，并不是在每棵树创建的时候随机每个结点上对特征选择都是从全量特征中进行采样对，不会剔除已利用的数据采样，是有放回的采样1个样本未被选到的概率为p = (1 - 1/N)^N = 1/e，即为OOB森林：多决策树组合可分类可回归，回归是对输出值进行简单平均，分类是对输出值进行简单投票随机森林用的是什么树？CART树随机森林的生成过程？生成单棵

2020-09-25 15:26:27 5446

原创 lr

logistic分布函数和密度函数，手绘大概的图像分布函数：密度函数：其中，μ表示位置参数，γ为形状参数。logistic分布比正太分布有更长的尾部且波峰更尖锐LR推导，基础5连问基础公式f(x) = wx + by = sigmoid(f(x))可以看作是一次线性拟合+一次sigmoid的非线性变化伯努利过程对于lr来说事情只有发生和不发生两种可能，对于已知样本来说，满足伯努利的概率假设：p(y=1/x,θ) = h(θ,x)p(y=0/x,θ) = 1-h(θ,x

2020-09-25 15:17:27 298

原创决策树

常见决策树模型ID3C4.5CART结构多叉树多叉树二叉树特征选择信息增益信息增益率Gini系数/均方差连续值处理不支持支持支持缺失值处理不支持支持支持枝剪不支持支持支持简述决策树构建过程构建根节点，将所有训练数据都放在根节点选择一个最优特征，按照这一特征将训练数据集分割成子集，使得各个子集有一个在当前条件下最好的分类如果子集非空，或子集容量未小于最少数量，递归1，2步骤，直到所有训练数据子集都被正确分类或没有合适

2020-09-25 15:17:02 190

原创 kmeans

请问从EM角度理解kmeans?k-means是两个步骤交替进行，可以分别看成E步和M步M步中将每类的中心更新为分给该类各点的均值，可以认为是在「各类分布均为单位方差的高斯分布」的假设下，最大化似然值；E步中将每个点分给中心距它最近的类（硬分配），可以看成是EM算法中E步（软分配）的近似为什么kmeans一定会收敛?M步中的最大化似然值，更新参数依赖的是MSE，MSE至少存在局部最优解，必然收敛kmeans初始点除了随机选取之外的方法？先层次聚类，再在不同层次上选取初始点进行kmeans聚

2020-09-25 15:15:50 124

原创 Xgboost

xgboost对比gbdt/boosting Tree有了哪些方向上的优化？显示的把树模型复杂度作为正则项加到优化目标中优化目标计算中用到二阶泰勒展开代替一阶，更加准确实现了分裂点寻找近似算法暴力枚举近似算法（分桶）更加高效和快速数据事先排序并且以block形式存储，有利于并行计算基于分布式通信框架rabit，可以运行在MPI和yarn上实现做了面向体系结构的优化，针对cache和内存做了性能优化xgboost和gbdt的区别？模型优化上：基模型的优化：gbd

2020-09-25 15:15:22 141

原创 LightGBM

XGboost缺点每轮迭代时，都需要遍历整个训练数据多次。如果把整个训练数据装进内存则会限制训练数据的大小；如果不装进内存，反复地读写训练数据又会消耗非常大的时间预排序方法需要保存特征值，及特征排序后的索引结果，占用空间level-wise，在训练的时候哪怕新增的分裂点对loss增益没有提升也会先达到预定的层数LightGBM对Xgboost的优化将连续的浮点特征离散成k个离散值，具体过程是首先确定对于每一个特征需要多少的桶bin，然后均分，将属于该桶的样本数据更新为bin的值，最后用直方图

2020-09-25 15:14:46 174

原创 GBDT

介绍一下Boosting的思想？初始化训练一个弱学习器，初始化下的各条样本的权重一致根据上一个弱学习器的结果，调整权重，使得错分的样本的权重变得更高基于调整后的样本及样本权重训练下一个弱学习器预测时直接串联综合各学习器的加权结果最小二乘回归树的切分过程是怎么样的？回归树在每个切分后的结点上都会有一个预测值，这个预测值就是结点上所有值的均值分枝时遍历所有的属性进行二叉划分，挑选使平方误差最小的划分属性作为本节点的划分属性属性上有多个值，则需要遍历所有可能的属性值，挑选使平方误差最小的划分

2020-09-25 15:14:12 264

原创抽取式文本摘要的提取

抽取式文本摘要的提取一、基于词频统计实现本文自动文本摘要（一）介绍（二）实现步骤（三）句子打分原理(四)代码实现一、基于词频统计实现本文自动文本摘要（一）介绍1、依据就是词频统计实现本文自动文本摘要提取2、文章是由句子组成的，文章的信息都包含在句子中，有些句子包含的信息多，有些句子包含的信息少。3、句子的信息量用"关键词"来衡量。如果包含的关键词越多，就说明这个句子越重要。4、"自动摘要"就是要找出那些包含信息最多的句子，也就是包含关键字最多的句子5、而通过统计句子中关键字的频率的大小，进而进

2020-09-03 15:36:15 2618

原创 linux下使用ssh登录另一台服务器

Linux下使用ssh登录另一台服务器使用SSH命令从一台Linux远程登陆到另一台Linuxlinux 将一个服务器上的文件或者文件夹复制到另一台服务器上linux使用 tar 压缩文件参考使用SSH命令从一台Linux远程登陆到另一台Linux命令格式：ssh 用户名@IP示例：ssh root@192.168.1.10回车，然后根据提示输入登陆密码即可linux 将一个服务器上的文件或者文件夹复制到另一台服务器上（1）将本地文件拷贝到远程scp 文件名用户名@计算机IP或者计算机名

2020-08-21 15:56:38 4854

原创贝叶斯

解释一下朴素贝叶斯中考虑到的条件独立假设讲一讲你眼中的贝叶斯公式和朴素贝叶斯分类差别贝叶斯公式是完整的数学公式P(A/B) = P(A)P(B/A)/P(B)朴素贝叶斯 = 贝叶斯公式 + 条件独立假设，在实际使用过程中，朴素贝叶斯完全只需要关注P(A,B)=P(A)P(B/A)即可朴素贝叶斯中出现的常见模型有哪些多项式：多项式模型适用于离散特征情况，在文本领域应用广泛，其基本思想是：我们将重复的词语视为其出现多次因为统计次数，所以会出现0次可能，所以实际中进行了平滑操作先验平滑：

2020-08-20 11:57:01 154

原创对于localhost、127.0.0.1、 0.0.0.0 的理解

对于localhost、127.0.0.1、 0.0.0.0 的理解localhost、127.0.0.1和0.0.0.0和本机IP的区别127.0.0.10.0.0.0参考链接：localhost、127.0.0.1和0.0.0.0和本机IP的区别127.0.0.1首先我们要先知道一个概念，凡是以127开头的IP地址，都是回环地址（Loop back address），其所在的回环接口一般被理解为虚拟网卡，并不是真正的路由器接口。所谓的回环地址，通俗的讲，就是我们在主机上发送给127开头的IP地址

2020-08-20 11:42:08 1037

原创 git 的简单使用

git 的简单安装参考官网如何ubuntu安装git查看git版本初始化操作参考官网参考 git官网：https://git-scm.com/download/linux如何ubuntu安装gitsudo add-apt-repository ppa:git-core/ppa sudo apt update sudo apt install git查看git版本git --version初始化操作#建立新文件夹mkdir learn_gitcd lern_git#查看文件夹中

2020-06-20 11:28:49 210

原创 anaconda +python3+OpenGL

anaconda +python3+OpenGL参考：https://blog.csdn.net/qq_40960304/article/details/88139248conda install --channel https://conda.anaconda.org/menpo PyOpenGLconda install --channel https://conda.anaconda....

2019-04-16 23:36:18 1739

原创 Task3 XGB算法梳理

MySQL任务4打卡参考1：https://blog.csdn.net/buxihuannicheng/article/details/89055953参考2：https://shimo.im/docs/PMYvg9rsj2c4i2qU

2019-04-11 23:06:57 187

原创 GBDT算法梳理

Gradient Boosting Decision Tree梯度决策提升树参考：https://shimo.im/docs/U5roNEO8KOgPtWY7

2019-04-11 15:22:33 146

原创 MySQL学习之二

MySQL学习之二参考：https://blog.csdn.net/hujiawen123456789/article/details/89022370https://shimo.im/docs/RaHgIwLd0zA6QZQk

2019-04-04 21:08:09 169

原创 Task 1(3天)

MySQLTask 1(3天)1.1 - MySQL 软件安装及数据库基础1.2 - MySQL 基础（一）- 查询语句功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UM...

2019-04-01 21:54:12 257

转载霍夫变换及其拓展

霍夫变换及其拓展

2018-06-22 16:43:17 182

转载图像匹配和配准

作者：落山链接：https://www.zhihu.com/question/39513724/answer/82031916来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。基于灰度的匹配一般被称为模版匹配，直接以灰度进行匹配效果不好，对光照很敏感，所以一般会以灰度归一化互相关（NCC）作为匹配依据，增强光照变化下的鲁棒性，为了降低计算量，多采用图像金字塔来实现先粗后...

2018-06-06 16:42:56 3170

转载强大的矩阵奇异值分解(SVD)及其应用

2018-06-05 16:29:33 247

转载 CSDN-markdown编辑器使用方法

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...

2018-06-01 22:39:33 116

原创点云的简述

点云数据的深度学习方法研究则进展缓慢的原因：1.点云具有无序性：　　受采集设备以及坐标系影响，同一个物体使用不同的设备或者位置扫描，三维点的排列顺序千差万别，这样的数据很难直接通过End2End的模型处理。2.点云具有稀疏性: 　　在机器人和自动驾驶的场景中，激光雷达的采样点覆盖相对于场景的尺度来讲，具有很强的稀疏性。在KITTI数据集中，如果把原始的激光雷达点...

2018-06-01 22:19:04 2618