机器学习
零一睡不醒
人生苦短
展开
-
cv2报错:Problematic frame: C [cv2.cpython-36m-x86_64-linux-gnu.so+0xcd0696]
python使用模块cv2过程中,报错:## A fatal error has been detected by the Java Runtime Environment:## SIGSEGV (0xb) at pc=0x00007fe9ef5e3696, pid=25302, tid=0x00007fea12c4c740## JRE version: Java(TM) SE Runtime Environment (8.0_201-b09) (build 1.8.0_201-b09)原创 2020-11-02 16:16:54 · 968 阅读 · 0 评论 -
相似度计算之Jaccard系数
Jaccard相似系数定义给定两个集合A,B,Jaccard 系数定义为A与B交集的大小与A与B并集的大小的比值,定义如下:当集合A,B都为空时,J(A,B)定义为1。与Jaccard 系数相关的指标叫做Jaccard 距离,用于描述集合之间的不相似度。Jaccard 距离越大,样本相似度越低。公式定义如下:其中对参差(symmetric difference)...原创 2018-11-13 10:23:22 · 64557 阅读 · 13 评论 -
神经网络反向传播算法numpy实现
一、任务实现一个4 层的全连接网络实现二分类任务,网络输入节点数为2,隐藏层的节点数设计为:25,50,25,输出层2 个节点,分别表示属于类别1 的概率和类别2 的概率,如图所示。我们并没有采用Softmax 函数将网络输出概率值之和进行约束,而是直接利用均方差误差函数计算与One-hot 编码的真实标签之间的误差,所有的网络激活函数全部采用Sigmoid 函数,这些设计都是为了能直接利用梯...原创 2019-12-23 17:19:00 · 2115 阅读 · 1 评论 -
交叉熵与KL散度
https://blog.csdn.net/fantacy10000/article/details/90668839转载 2019-12-23 11:19:54 · 127 阅读 · 0 评论 -
BP算法记录
一文彻底搞懂BP算法:原理推导+数据演示+项目实战(上篇)一文彻底搞懂BP算法:原理推导+数据演示+项目实战(下篇)深度学习 --- BP算法详解(误差反向传播算法)非常详细的讲解了何为BP...原创 2019-10-22 15:13:32 · 259 阅读 · 0 评论 -
深度学习之RNN(循环神经网络)
对深度学习之RNN(循环神经网络)的理解。RNN网络存在三个矩阵在不同时刻权重共享,即从头到尾只需要计算这三个矩阵。U:输入层到隐层的矩阵V:隐层到输出层W:隐层到自身的矩阵二、反向传播RNN损失为各个时间点的损失之和,故各个梯度的变化为各个时间点梯度变化之和RNN语言模型为例子,损失函数使用交叉熵,其中yt为t时刻正确的词语,y^t为t时刻预测的词语。分别...原创 2019-10-22 13:37:52 · 236 阅读 · 0 评论 -
判别式模型与生成式模型
判别式模型与生成式模型机器学习模型有两个重要类别:判别式模型与生成式模型。这两种模型的区别,是很多初学者会遇到的一个坎儿。判别式模型的意思是,给出一条数据,模型要为数据给出一个类别。一般来说,数据是比较复杂的,比如一句话、一张图这样的;类别则比较简单,一般就是「是」或「否」,或者有限的几个类别。用 X 表示数据,Y 表示类别,则判别式模型建模的就是 P(Y|X)。至于 X 本身的分布是怎样...原创 2019-07-25 10:27:37 · 237 阅读 · 0 评论 -
最优化算法—拟牛顿法
https://blog.csdn.net/lyy_sha/article/details/80594931原创 2019-05-13 10:04:59 · 682 阅读 · 0 评论 -
DeepFM 中参数的理解
上图为Sparse Feature 层到 Dense Embedding 层的神经元连接示意图。1、每个圆点代表一个神经元,神经元本身是没有数值的,我们需要知道的是Sparse Feature 到 Embedding 层之间连线的权重,这个权重就是所谓的Embedding Vector。2、一共有m个field,每个field对应k个嵌入维数,所以嵌入层神经元的个数为m*k。3、...原创 2019-04-24 15:41:08 · 3045 阅读 · 0 评论 -
GBDT
1 一个GBDT的实例讲解https://blog.csdn.net/blank_tj/article/details/822624312 GBDT 分类原理及python实现https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/82719765原创 2019-04-23 11:07:31 · 124 阅读 · 0 评论 -
梯度下降的数学思考
1、为什么负梯度方向上函数数值下降最快https://blog.csdn.net/sr_19930829/article/details/81058098原创 2019-04-23 10:13:23 · 101 阅读 · 0 评论 -
根据中文姓名预测性别 (python实现)
来源于这个比赛:http://sofasofa.io/competition.php?id=3#c1贝叶斯相关知识:http://sofasofa.io/tutorials/naive_bayes_classifier/原创 2019-04-26 14:58:35 · 5795 阅读 · 1 评论 -
机器学习算法(一)SVD
前言:特征值分解: 其中Q是这个矩阵A的特征向量组成的矩阵,Σ是一个对角阵,每一个对角线上的元素就是一个特征值。特征值分解可以得到特征值与特征向量,特征值表示的是这个特征到底有多重要,而特征向量表示这个特征是什么,可以将每一个特征向量理解为一个线性的子空间,我们可以利用这些线性的子空间干很多的事情。不过,特征值分解也有很多的局限,比如说变换的矩阵必须是方阵。 一、奇异值奇异值分...原创 2018-12-03 10:26:28 · 266 阅读 · 1 评论