deep learning
文章平均质量分 50
titake
这个作者很懒,什么都没留下…
展开
-
为什么β>1 时 F-score中召回率越重要
模型训练中根据precision 和 recall计算F-score进而全面考虑准确率和召回率。如果认为 准确率和召回率同等重要,就让β = 1,这就是F-1 score如果认为召回率更重要,就设定 β > 1。如果认为精确率更重要,就设定 β < 1这是因为,当 β 趋近于正无穷时,F-Score趋近于Recall rate;而当 β 趋近于 0 时,F-Score趋近于 Precision。...原创 2021-11-18 14:54:12 · 759 阅读 · 2 评论 -
Model was constructed with shape for input Tensor(). but it was called on an input with incompatible
:Model was constructed with shape (None, 9, 7, 1) for input Tensor("input_1:0", shape=(None, 9, 7, 1), dtype=float32), but it was called on an input with incompatible shape (1, 9, 28, 1).在构建深度模型,并进行训练的过程中原创 2021-06-02 11:00:21 · 3328 阅读 · 4 评论 -
attention机制
文章有点看不下去了,所以先来输出一波吧。唠一唠attention机制。一、背景:attention机制出家自NLP中的文本翻译。最朴素的翻译是,一个单词一个单词的蹦。翻译出来的效果那就是七零八落,能稍微明白个意思。那要想翻译好怎么整呢,长难句老师教我们,先看一遍整个句子,然后找出定语从句.... 反正大概就这么个意思。那就是说要关注单词和单词之间的联系了。那这个单词和单词之间的联系要怎么度量呢?attention 机制!我们都知道单词可以用word2vec学习到其向量表示。seq2seq模型中,原创 2021-01-13 18:07:36 · 813 阅读 · 0 评论 -
keras - 构建并训练一个model--超级基础篇
点开这个博客的人,估计都知道Keras是什么。但是我作为一个小白,还是先来聊一下keras是什么。像tensorflow一样,Keras是个python库,不过里面都是神经网络的东西。我们深度学习要训练一个模型,而一个模型中有很多小组件。比如用什么激活函数,relu还是sigmoid 用什么optimizer,gradientdescent还是adam 要不要加个 regu...原创 2020-02-14 07:04:17 · 1643 阅读 · 0 评论