机器学习
zhenyu wu
这个作者很懒,什么都没留下…
展开
-
图解一维卷积层(PyTorch)
图解一维卷积层(PyTorch)在NLP中,我们需要对文本做embedding表示,那么embedding之后的文本做一维卷积运算的过程到底是什么样子的呢?我们给出下图加以说明原创 2020-12-08 20:10:41 · 5050 阅读 · 0 评论 -
什么是张量?
什么是张量 本文中我们用积木、小箭头、纸板以及指向箭头来描述向量以及张量的一些概念。向量具有方向和大小,其长度表示大小,箭头的指向表示其方向。向量可以表示一个平面原创 2020-06-29 10:15:43 · 3073 阅读 · 0 评论 -
通俗易懂的Word Embeddings
通俗易懂的Word Embeddings Word Embeddings是机器学习领域最酷的事情之一,因为它可以从海量的文本数据中挖掘出单词之间纷繁复杂的联系。例如你可以在不给定任何先验知识的情况下,利用Word Embeddings学习到所有和颜色相关的词汇。为了方便理解,我们先给出一个简单的例子:I painted the bench _______ 不难发现上述例句中缺少一个单词,显然这里需要填入一个有关色彩的词汇,例如:I painted the bench redI painted原创 2020-06-28 08:42:52 · 1290 阅读 · 0 评论 -
图解Transformer
图解Transformer 在上一篇文章中我们一起讨论了现代深度学习模型中无处不在的一种方法——注意力。注意力能够提高神经机器翻译应用程序的性能。 在这篇文章中,我们将一起学习Transformer模型,它使用注意力来提升其训练速度。Transformer模型在特定任务中的表现优于谷歌神经机器翻译模型。不过,Transformer最大的亮点在于并行化。事实上,谷歌云推荐使用Transformer作为参考模型来使用他们的云端TPU产品。接下来,我们试着把这个模型拆开来,看看它的功能是怎么实现的。...翻译 2020-07-08 08:51:09 · 572 阅读 · 0 评论 -
人人都能看懂的循环神经网络RNN
循环神经网络 我们假设您有一个管家,他很擅长做苹果派、汉堡以及炸鸡这三样食物。管家制作食物的种类取决于天气,若是晴天,他会做苹果派;若是雨天,他会做汉堡。这样制作食物的规则很容易用神经网络来表示。 我们接下来用数学语言描述上述过程,利用一些向量表示食物,再用一些向量表示天气。苹果派=[100] 苹果派= \left[ \begin{matrix} 1\\ 0\\ 0 \end{matrix} \right]苹果派=⎣⎡100⎦⎤...原创 2020-06-26 11:11:58 · 331 阅读 · 0 评论 -
利用Keras构建自动编码器
利用Keras构建自动编码器我们在这份学习指南中将回答有关自动编码器的一些常见问题,除此之外,我们也会给出下述模型的代码示例:基于全连接层的简单自动编码器稀疏自动编码器深度全连接自动编码器深度卷积自动编码器图像降噪模型序列到序列的自动编码器变分自动编码器注意:所有的代码示例已经在2017年3月14日更新到了Keras 2.0接口。你需要在Keras 2.0.0以及更高的版本下...原创 2019-12-23 08:54:21 · 498 阅读 · 0 评论 -
Edit Distance Python源码及支持包的实现
Edit Distance编辑距离编辑距离又称Levenshtein距离(莱文斯坦距离也叫做Edit Distance)指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。它可以用来做DNA分析,拼写检查,抄袭识别等。编辑操作只有三种插入、删除、替换三种操作。python代码片...原创 2019-12-03 16:13:17 · 1184 阅读 · 0 评论 -
时间序列分析
原创 2019-01-16 17:19:42 · 272 阅读 · 0 评论 -
回归预测
原创 2019-01-16 17:17:30 · 1106 阅读 · 0 评论 -
数据的EDA分析
原创 2019-01-16 17:14:26 · 3074 阅读 · 0 评论 -
二分类预测
本项目是数据的二分类分析,针对俄亥俄州诊所患者出现与否数据集No-show-Issue-Comma-300k进行样本的分类预测。首先进行特征探究,观察里面的连续变量,布尔值变量以及字符串变量,并绘制不同变量的分布图。然后对变量中的离群值以及明显错误数据进行清洗,探究各变量与状态变量之间的关系。最后分别用决策树,SGD,随机森林以及梯度Boosting对数据集做二分类预测,得到梯度Boosting在...原创 2019-01-18 13:59:35 · 5516 阅读 · 0 评论 -
聚类分析
本项目是数据的聚类分析,针对2014年AAAI收到的所有论文数据集[UCI] AAAI-14 Accepted Papers - Papers进行样本的聚类分析。首先进行特征转换,将数据集按照作者选定的高级关键词进行展开,然后分别用k-means、高斯混合模型、贝叶斯高斯混合模型对数据集进行聚类分析。并对聚类结果采用词云的方式进行可视化分析。最终得到贝叶斯高斯混合模型的聚类效果最好,将数据集聚为3...原创 2019-01-17 20:30:21 · 714 阅读 · 0 评论 -
机器学习&深度学习
机器学习&深度学习机器学习篇本代码模块对《机器学习实战》一书中的所有代码做了整理,解决了读者在阅读本书过程中困扰于书上有很多代码在Python3环境下不能运行的问题。我在代码中做了大量的注释,方便各位读者学习。代码地址:https://github.com/wzy6642/Machine-Learning-in-Action-Python3深度学习篇我在学习深度学习过程中,对代码做...原创 2019-01-10 20:01:17 · 422 阅读 · 0 评论