学习笔记（Task01~Task02）

最新推荐文章于 2024-08-31 23:27:49 发布

durobert

最新推荐文章于 2024-08-31 23:27:49 发布

阅读量98

点赞数

分类专栏：动手学深度学习

本文链接：https://blog.csdn.net/ds1995/article/details/104318920

版权

动手学深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文深入探讨了线性回归的基本要素，包括模型定义、损失函数与优化方法，如随机梯度下降。同时，文章介绍了分类模型的构建，涵盖Softmax函数的应用及交叉熵损失函数的计算。此外，还提供了文本预处理的实用步骤。

摘要由CSDN通过智能技术生成

学习笔记（Task01~Task02）

线性回归基本要素

模型

$\mathrm{price} = w_{\mathrm{area}} \cdot \mathrm{area} + w_{\mathrm{age}} \cdot \mathrm{age} + b$

labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b

损失函数

$L(\mathbf{w}, b) =\frac{1}{n}\sum_{i=1}^n l^{(i)}(\mathbf{w}, b) =\frac{1}{n} \sum_{i=1}^n \frac{1}{2}\left(\mathbf{w}^\top \mathbf{x}^{(i)} + b - y^{(i)}\right)^2$

def squared_loss(y_hat, y): 
    return (y_hat - y.view(y_hat.size())) ** 2 / 2

优化函数-随机梯度下降

$(\mathbf{w},b) \leftarrow (\mathbf{w},b) - \frac{\eta}{|\mathcal{B}|} \sum_{i \in \mathcal{B}} \partial_{(\mathbf{w},b)} l^{(i)}(\mathbf{w},b)$

def sgd(params, lr, batch_size): 
    for param in params:
        param.data -= lr * param.grad / batch_size

Softmax 与分类模型

回归模型

$\begin{aligned} \boldsymbol{o}^{(i)} &= \boldsymbol{x}^{(i)} \boldsymbol{W} + \boldsymbol{b},\\ \boldsymbol{\hat{y}}^{(i)} &= \text{softmax}(\boldsymbol{o}^{(i)}). \end{aligned}$

def net(X):
    return softmax(torch.mm(X.view((-1, num_inputs)), W) + b)

损失函数

$\ell(\boldsymbol{\Theta}) = -(1/n) \sum_{i=1}^n \log \hat y_{y^{(i)}}^{(i)}$

def cross_entropy(y_hat, y):
    return - torch.log(y_hat.gather(1, y.view(-1, 1)))

文本处理

预处理通常包括四个步骤：

读入文本
分词
建立字典，将每个词映射到一个唯一的索引（index）
将文本从词的序列转换为索引的序列，方便输入模型

durobert

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录