机器学习
文章平均质量分 94
ttv56
peking university
展开
-
RNN循环神经网络学习笔记
RNN循环神经网络学习笔记 本文图片截取自《Tensorflow 实战Google深度学习框架》 参考了Understanding LSTM Networks注意阅读本文需要先学习了最基本的神经网络知识以下是正文RNN其基本结构如图: 先解释一下该图为一个最简单的三层神经网络,即(输入-隐含-输出)结构,其中该神经网络的隐含层。图中为隐含层在第t个时间接受到的输入,为隐含层在第t个时间原创 2017-10-05 20:57:07 · 2409 阅读 · 0 评论 -
CNN做文本分类《Effective Use of Word Order for Text Categorization with Convolutional Neural Networks》
原文链接 本文发表于自然语言处理领域顶级会议 NAACL 2015摘要本文将CNN用于文本分类任务,没有像传统方法那样采用低维词向量作为输入,而是采用高维,还提出了一种在卷积中使用的词袋转换的变体,为了提高准确率,还探索了将多个卷积层结合的方法,实验表明效果不错。模型1.bow-CNN for text 假设我们有一个词库 V={我,他,它,爱,你}V={我...原创 2018-08-25 17:23:58 · 926 阅读 · 0 评论 -
深层CNN做文本分类《Very Deep Convolutional Networks for Natural Language Processing》
原文链接 本文是人工智能著名学者Yann Lecun的作品 代码链接摘要传统解决NLP任务的网络结构为RNN和CNN,但是比起在图像领域的效果,CNN在NLP领域的效果实在是差强人意,本文提出了一种新型的CNN结构,它直接在字符级别上进行操作,并且只使用简单的卷积和池化操作。本文实验表明,模型的性能随着深度的增加而增加,本文最终使用了29个卷积层,在公开数据集上进行...原创 2018-08-24 14:21:55 · 1870 阅读 · 1 评论 -
CNN文本分类《Convolutional Neural Networks for Text Categorization: Shallow Word-level vs. Deep Charact》
原文链接 本文仅在axive上发表摘要在文本分类领域,主要都是基于CNN和LSTM来做的,但是LSTM的复杂度比CNN高得多,一旦进行长文本或大量文本的训练,就会特别耗时,而CNN就要快得多。故本文在长文本分类领域对比了在字符级别和词语级别的CNN模型分别的效果:Our earlier work (2015) [3, 4]: shallow word-level C...原创 2018-08-24 12:48:29 · 1142 阅读 · 0 评论 -
论文笔记《Neural Factorization Machines for Sparse Predictive Analytics》
原文链接 本文发表于信息检索领域顶级会议 SIGIR 2017 代码链接摘要在当今互联网工业界中,有许多预测任务需要用到大量的类别特征。要想将这些类别特征送入到模型中,就必须得将其onehot。但这样一来,就会产生大量的稀疏特征...原创 2018-08-13 15:36:44 · 3408 阅读 · 2 评论 -
拒绝踩坑!从源码编译安装 Tensorflow 1.10GPU版本
致谢 tensorflow官方文档 How to Install Tensorflow GPU with CUDA 9.2 for Python on Ubuntu 以及一系列“十分有效”的解决方案及博文前言从源码编译安装tensorflow理论上可以安装tensorflow任意版本!从此不再踩坑!tensorflow gpu版本的安装一直是所有deep le...原创 2018-08-15 14:21:13 · 23101 阅读 · 7 评论 -
用神经网络做情感分类《Transformation Networks for Target-Oriented Sentiment Classification》
原文链接 本文发表于自然语言处理顶级会议 ACL 2018 项目源码链接摘要在情感分类任务中,人们关注的往往是一句话中所表露出情感的“最重要”的一部分,比如在美团上经常会有这种评价:“这家店的菜做的不错,但是服务特别差!”,而对于餐厅管理者来说,这条评论他们最关注的是“这家店服务特别差”这个部分,即整个句子对他们餐厅所表现出来的情感是“不满意”的,“这家店菜做的不错...原创 2018-07-29 15:23:22 · 5691 阅读 · 1 评论 -
多层感知机(Multi-Layer Perception)
鸣谢 多层感知机及其BP算法(Multi-Layer Perception)Deep Learning 近年来在各个领域都取得了 state-of-the-art 的效果,对于原始未加工且单独不可解释的特征尤为有效,传统的方法依赖手工选取特征,而 Neural Network 可以进行学习,通过层次结构学习到更利于任务的特征。得益于近年来互联网充足的数据,计算机硬件的发展以及大规模并行化的普及转载 2017-11-28 00:06:05 · 7839 阅读 · 0 评论 -
支持向量机详解(SVM)
鸣谢 本文引用了下列文章或书籍 1.《机器学习》俗称西瓜书,作者:周志华 2.用讲故事的办法帮你理解SMO算法 3.吴恩达CS299课堂资料说到支持向量机,首先得介绍一些基础知识,现在开始。凸集凸集定义:集合C内任意两点连成的线段(注意和仿射集的区别)都在集合C内,则C为凸集。 举个例子: 显然上图中,左图是凸集,右边那个像肾一样的肯定不是凸集~凸包凸包定义:包含集合C的原创 2017-10-22 16:10:26 · 3775 阅读 · 1 评论 -
矩阵奇异值分解(SVD)与主成份分析(PCA)详解
鸣谢 本文引用了如下文章,如有侵权,请联系删除 主成分分析(PCA)原理详解 邹博机器学习教程矩阵奇异值分解(SVD)奇异值分解(Singular Value Decomposition)是一种重要的矩阵分解方法,可以看作对称方阵在任意矩阵上的推广。假设A是一个m*n阶实矩阵,则存在一个分解使得: Am∗n=Um∗mσm∗nVTn∗nA_{m*n}=U_{m*m}\sigma_{原创 2017-11-13 15:21:00 · 6716 阅读 · 0 评论 -
(蒙特卡洛方法)求任意一点(X,Y)落在心形区域的概率(2017阿里在线编程题)
这个题首先2和3看不清坑了很多人,应该是3次方而不是2次方 真是看瞎了自己的钛合金狗眼啊 = =不多说,上高清大图: 看到这个题目,第一反应就是蒙特卡洛方法,现在来介绍一下什么是蒙特卡洛方法,其实很简单的定义,即: 当所求解问题是某种随机事件出现的概率,或者是某个随机变量的期望值时,通过某种“实验”的方法,以这种事件出现的频率估计这一随机事件的概率,或者得到这个随机变量的某些数字特征,并原创 2017-10-15 23:09:44 · 3429 阅读 · 0 评论 -
Elmo原文翻译
原文链接#Deep contextualized word representations##1.Introduction什么是一个好的词向量能够反映出语义和语法的复杂特征.能够准确的对不同上下文进行反应.deep contextualized 词向量的特点使用理念方面:在原先的词向量模型中, 每个词对应着一个向量, 但是这个模型是根据一个句子赋予每个词汇向量. 因此对...原创 2019-03-17 18:07:40 · 2724 阅读 · 0 评论