Deep Learning2-CSDN博客

本文链接：https://blog.csdn.net/YoutiaoNo2/article/details/109568821

SGD:
SGD with momemtum
Adagrad:
$\theta_{t} = \theta_{t-1}-\frac{n}{\sqrt{\sum_{i=0}^{t-1}(g_{i})^2}}g_{t-1}$
RMSProp:
$\theta_{t} = \theta_{t-1}-\frac{\eta}{\sqrt{\nu_{t}}}g_{t-1}$
$\nu_1 = g_0^2$
$\nu_{t} = \alpha \nu_{t-1}+(1-\alpha)(g_{t-1})^2$
Adam
SGDM vs Adam

把每个词表示成一个固定向量(token)。
Contextualized word embedding指的是：word tokens depends on its context，同一个词根据不同的上下文有不同的向量表示。

在这里插入图片描述

在这里插入图片描述

用途：让机器知道 ‘我不知道’ 这件事情
问题：给定一个训练集，寻找一个function来检测输入x是否相似于训练数据，是否能被归入训练集
应用：
- Fraud Detection: 正常刷卡行为? 盗刷?
  Ref: https://www.kaggle.com/ntnu-testimon/paysim1/home
  Ref: https://www.kaggle.com/mlg-ulb/creditcardfraud/home
- Network Intrusion Detection: 正常网络行为？攻击行为?
  Ref: http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
- Cancer detection：正常细胞？癌细胞？
  Ref: https://www.kaggle.com/uciml/breast-cancer-wisconsin-data/home
case1有标签
- 如何衡量异常检测系统的好坏：使用cost table惩罚第一类错误拒真或者惩罚第二类错误纳伪，理论上优先惩罚拒真。
- 如何得到Anomaly？生成模型生成。
case2无标签
使用maximum likelihood来计算分布概率，使用阈值区分。
AutoEncoder: 若同类可以很好地还原，不能很好还原的数据即为Anomaly。
One class SVM
Isolation Forest