TianHongZXY-CSDN博客

原创使用pytorch和torchtext进行文本分类

如何使用pytorch进行文本分类文本分类是NLP领域的较为容易的入门问题，本文记录我自己在做文本分类任务以及复现相关论文时的基本流程，绝大部分操作都使用了torch和torchtext两个库。1. 文本数据预处理首先数据存储在三个csv文件中，分别是train.csv，valid.csv，test.csv，第一列存储的是文本数据，例如情感分类问题经常是用户的评论review，例如imdb或...

2019-10-27 21:51:34 5270 12

原创浅谈L2正则化为什么有效

L2正则化为什么有效无论是学过机器学习还是深度学习的同学一定知道正则化可以缓解过拟合，最常用的就是L2正则化，即在损失函数J(θ)J(\theta)J(θ)上加上参数的L2范数λ∣∣θ∣∣2\lambda||\theta||_{2}λ∣∣θ∣∣2，不过一般也不开根号了，也就是直接加λ∑iθi2\lambda\sum\limits_{i}\theta_{i}^{2}λi∑θi2，λ\lambdaλ是正则化因子，它的大小决定了你有多想让参数向0靠近。如果被问到缓解过拟合的方法，那么L2正则化肯定是要知

2020-06-09 18:19:01 1009

原创自然语言推理入门：ESIM

Enhanced LSTM for Natural Language InferenceESIM是ACL2017的一篇论文，在当时成为各个NLP比赛的杀器，直到现在仍是入门自然语言推理值得一读的文章。本文根据ESIM原文以及pytorch代码实现对ESIM模型进行总结，有些地方的叙述保持了与代码一致而和原文不一致，比如在embedding处与原文就不完全一致，原论文只使用了我下面所写的init...

2020-05-04 22:14:33 1660

原创深度知识追踪入门

背景介绍知识追踪（Knowledge Tracing）是根据学生过去的答题情况对学生的知识掌握情况进行建模，从而得到学生当前知识状态表示的一种技术，早期的知识追踪模型都是依赖于一阶马尔科夫模型，例如贝叶斯知识追踪（Bayesian Knowledge Tracing）。将深度学习的方法引入知识追踪最早出现于发表在NeurIPS 2015上的一篇论文《Deep Knowledge Tracing》...

2020-04-24 18:27:02 2670

原创反讽检测(Sarcasm Detection)

最近在看反讽检测的文章，才读了几篇，写一下小结，看得还是挺费劲，也挺懵的，写个阅读笔记，让自己好好重新理解一下。Towards Multimodal Sarcasm Detection第一篇读的是Towards Multimodal Sarcasm Detection (An Obviously Perfect Paper) ，标题就很有意思，斜体的Obviously就是在这就带有自嘲，反语的...

2019-12-08 12:07:42 4567 3

原创利用pytorch和torchtext预处理数据

pytorch广播矩阵当自定义矩阵来和一个 batch 的数据 X 做乘法的时候，设X.shape = [batch_size, dimx, dimy]，那么自定义的矩阵 W.shape = [input_dim, output_dim]只需要input_dim==dimy就可以使用torch.matmul(X, W)，pytorch在计算的时候会自动广播矩阵W，但计算完 W.shape 不会...

2019-07-10 17:15:00 3395 2

翻译 TPYBoard v202学习笔记（1）

查看文件import osos.listdir()打开文件# 只读方式打开main文件f = open('main.py', 'r')f.read()# 操作结束记得close释放资源f.close()联网 network类库AP模式: Access Point，提供无线接入服务，允许其它无线设备接入，提供数据访问，一般的无线路由/网桥工作在该模式下。AP和AP之间允许相互...

2018-11-12 10:05:04 2862

原创如何将cifar-10数据集的图片转化为227*227像素以供Alexnet训练

下载cifar-10数据集官网地址：http://www.cs.toronto.edu/~kriz/cifar.html这是从官网下载好的python版cifar-10数据集加载cifar-10数据集def load_file(cifar): '''加载cifar数据集''' import pickle with open('D:\cifar-10-ba...

2018-10-09 18:00:53 10742 3

原创线性回归（logistic regression）

单变量线性回归本文以单变量线性回归为例，且变量为一次方，多变量只需要增加变量x1，x2······的个数，变量x也可以有更高的次方。h代表假设函数theta代表参数x代表输入变量y代表标签J代表损失函数目标即为通过改变参数theta的值，最小化损失函数，即要使假设函数h的输出尽可能接近标签y。例如预测房价问题，令输入x为房子的尺寸（m^2），y为已知的对应x的房价（万元），则要通...

2018-10-03 13:49:48 366

原创评估机器学习项目性能的指标

单一数字评估指标（Single number evaluation metric）查全率（recall）与查准率（precision）评估机器学习项目的性能的指标最常用的有两个，分别是查全率和查准率。假如你做了两个识别猫的分类器A和B。当分类器识别图片为猫，记为positive，识别为其他，记为negative。查全率是指，对于所有的真猫图片，你的分类器正确识别出了多少百分比。 ...

2018-09-15 17:39:13 398

原创正交化（Orthogonalization）

正交化（Orthogonalization）机器学习中可以调整的参数非常多，比如电视机上的按钮，有调整图像高度的旋钮，调整宽度的旋钮，以及调亮度，对比度等各种旋钮，互不影响。在旋每一个旋钮时，你都清楚的知道自己在调整什么，会得到什么样的效果，调整高度并不会影响到亮度，反之亦然，所以只要根据当前的情况，例如图像偏窄，亮度偏暗，你明确地知道应该调整哪两个旋钮，往哪个方向旋转，直到得到你满意的效...

2018-09-15 17:13:36 10877

原创机器学习的偏差(bias)和方差(variance)问题

减少偏差偏差过大又称欠拟合（underfitting），原因通常是：模型太过简单，无法很好地拟合样本点。训练集太小。训练轮数太少，即训练时间太短。解决的办法自然是：使用更复杂的模型，在神经网络中增加隐藏层或隐藏单元。增长训练时间，使用更先进的优化算法。收集更多数据加入训练集（当模型无法很好拟合当前训练集时，此方法并无多大作用）解决偏差问题是最基本的要求，是最低标...

2018-09-09 15:49:12 771

原创深度学习——学习率衰减(learning rate decay)

学习率衰减(learning rate decay)为了防止学习率过大，在收敛到全局最优点的时候会来回摆荡，所以要让学习率随着训练轮数不断按指数级下降，收敛梯度下降的学习步长。学习率衰减可以用以下代码实现 decayed_learning_rate = learning_rate * np.power(decay_rate,(global_step / decay_steps)）de...

2018-09-08 16:03:28 42094 2

原创 Tensorflow简单操作入门

创建constant`constant_v = tf.constant(数值, name='constant_v')`如X = tf.constant(np.random.randn(3,1),name = 'X')y = tf.constant(39, name='y')创建变量variable_v = tf.Variable(算式, name='variable_...

2018-09-02 13:27:33 153

python机器学习

机器学习，如今最令人振奋的计算机领域之一。看看那些大公司，Google、Facebook、Apple、Amazon早已展开了一场关于机器学习的军备竞赛。从手机上的语音助手、垃圾邮件过滤到逛淘宝时的物品推荐，无一不用到机器学习技术。如果你对机器学习感兴趣，甚至是想从事相关职业，那么这本书非常适合作为你的第一本机器学习资料。市面上大部分的机器学习书籍要么是告诉你如何推导模型公式要么就是如何代码实现模型算法，这对于零基础的新手来说，阅读起来相当困难。而这本书，在介绍必要的基础概念后，着重从如何调用机器学习算法解决实际问题入手，一步一步带你入门。即使你已经对很多机器学习算法的理论很熟悉了，这本书仍能从实践方面带给你一些帮助。具体到编程语言层面，本书选择的是Python，因为它简单易懂。我们不必在枯燥的语法细节上耗费时间，一旦有了想法，你能够快速实现算法并在真实数据集上进行验证。在整个数据科学领域，Python都可以说是稳坐语言榜头号交椅。

2018-12-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人