NLP入门
文章平均质量分 73
读研的nlp总结
Gentle灬Flying
这个作者很懒,什么都没留下…
展开
-
文本情感分析实战
文本情感分析本例子基于IMDB的数据集,对数据集中每句话进行情感分析,并输出它的情感色彩指数。1. 获取数据集def tokenize(content): content = re.sub("<.*?>", " ", content) # print(content) filter = ['\t','\n', '\x96', '\x97', "\.", "\,", "\(", "\)"] content = re.sub("|".join(filter),原创 2021-09-15 00:28:45 · 577 阅读 · 0 评论 -
数字识别(训练MNIST数据集实例)
数字识别以下是个图片数字识别的例子,数据集来自torchvision的MNIST,使用交叉熵计算损失,使用两层的全连接进行训练。1. 数据集的获取获取MNIST的数据集:dset.MNIST(root, train=True, transform=None, target_transform=None, download=False)参数说明: - root : processed/training.pt 和 processed/test.pt 的主目录 - train : True = 训练集原创 2021-09-13 13:25:14 · 1075 阅读 · 0 评论 -
机器学习入门 - 梯度算法
1. 梯度是什么?梯度 : 一个向量,导数+变化最快的方向机器学习:收集数据x, 构建模型f,通过f(x, w) = Ypredict判断模型质量的方法,计算lossloss=(Ypredict−Ytrue)2(回归损失)loss=Ytrue⋅log(Ypredict)(分类损失)loss = (Y_{predict} - Y_{true})^2 \quad (回归损失)\\loss = Y_{true}·log(Y_{predict}) \quad (分类损失)loss=(Ypredict原创 2021-09-11 15:28:48 · 6273 阅读 · 0 评论