- 博客(433)
- 收藏
- 关注
转载 机器阅读理解相关论文汇总
一、综述 1 Emergent Logical Structure in Vector Representations of Neural Readers 二、论文 1. Learning Recurrent Span Representations for Extr...
2017-09-26 11:58:00
514
转载 Ubuntu14.04下安装SublimeText3
本文的系统环境是:Ubuntu 14.04 到这里下载deb包(或者直接点击下载链接),下载完成后,右键并选择“用软件中心打开安装”。 注:下载的文件是: sublime-text_build-3114_amd64.deb 安装完后只有一句话:这个程序需要从终端启动subl...
2016-06-15 11:04:00
139
转载 NFS是什么
什么是NFS呢? 它是Network File system的缩写,即网络文件系统。 NFS是由SUN公司开发,并于1984年推出的一个RPC服务系统,它使我们能够达到文件的共享,在不同的系统间使用,所以它的通信协议设计与主机及操作系统无关。当用户想使用远程文件时只要用“mount”命令就...
2016-06-15 11:04:00
271
转载 深度学习与自然语言处理之五:从RNN到LSTM
大纲如下: 1.RNN 2.LSTM 3.GRN 4.Attention Model 5.应用 6.探讨与思考 文章转载自:http://bl...
2016-06-15 11:04:00
62
转载 用简单易懂的语言描述过拟合 overfitting?
转载自知乎: https://www.zhihu.com/question/32246256 转载于:http...
2016-06-15 11:04:00
70
转载 创建GitHub技术博客全攻略
说明: 首先,你需要注册一个 github 账号,最好取一个有意义的名字,比如姓名全拼,昵称全拼,如果被占用,可以加上有意义的数字. 本文中假设用户名为 tiemaocsdn 1. 注册账号: 地址: https://github.com/ 输入账号、邮箱、密码,然后点击注册...
2016-06-15 11:04:00
63
转载 基于Theano的深度学习(Deep Learning)框架Keras学习随笔-03-优化器
原地址:http://blog.csdn.net/niuwei22007/article/details/49131393可以查看更多文章 optimizers(优化器)。机器学习包括两部分内容,一部分是如何构建模型,另一部分就是如何训练模型。训练模型就是通过挑选最佳的优化器去训练出最优...
2016-06-15 11:04:00
62
转载 计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接
以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等等。打算从事这个行业或者刚入门的朋友可以多关注这些网站,多了解一些CV的具体应用。搞研究的朋友...
2016-06-15 11:04:00
224
转载 使用Stanford Word Segmenter and Stanford Named Entity Recognizer (NER)实现中文命名实体识别...
一、分词介绍 http://nlp.stanford.edu/software/segmenter.shtml 斯坦福大学的分词器,该系统需要JDK 1.8+,从上面链接中下载stanford-segmenter-2014-10-26,解压之后,如下图所示 ...
2016-06-15 11:04:00
75
转载 卷积神经网络在句子分类上的应用[翻译]
标题 Convolutional Neural Networks for Sentence Classification 卷积神经网络在句子分类上的应用 原文地址:http://arxiv.org/abs/1408.5882 作者 Yoon Kim New York...
2016-06-15 11:04:00
265
转载 如何导入MAVEN项目到MyEclipse中
方法一: 1 首先myeclipse集成maven环境 2 然后import-》Maven-》exiting maven projects,选择maven工程,导入 3 jar不用手动添加,在maven工程的根目录下的pom.xml文件中定义jar依赖即可。 方法二: 在mvn的...
2016-06-15 11:04:00
197
转载 循环神经网络(RNN, Recurrent Neural Networks)介绍
循环神经网络(RNN, Recurrent Neural Networks)介绍 循环神经网络(Recurrent Neural Networks,RNNs)已经在众多自然语言处理(Natural Language Processing, NLP)中取得了巨大成功以及广泛应用。但是,目前...
2016-06-15 11:04:00
105
转载 数据挖掘算法学习(一)K-Means算法
博主最近实习开始接触数据挖掘,将学习笔记分享给大家。目前用的软件是weka,下篇文章会着重讲解。 转载请附上链接http://blog.csdn.net/iemyxie/article/details/38173495 算法简介: K-Means算法是输入聚类个数k,以及包...
2016-06-15 11:04:00
107
转载 推荐!国外程序员整理的机器学习资源大全
本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。 C++计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, An...
2016-06-15 11:04:00
110
转载 Hadoop2.2.0 HA + Jdk1.8.0 + Zookeeper3.4.5 + Hbase0.98 集群搭建详细过程(服务器集群)
一、前言 过完年在外实习,实习中的一部分主要工作就是关于hadoop的搭建和维护。其实hadoop的搭建本身并不是什么难题,主要是当一些之前没怎么用过linux、没怎么用到java的可怜的孩纸们来搞hadoop的时候会相当的揪心,非常不巧我也是的。因此可以说,学hadoop的过程是一个很痛...
2016-06-15 11:04:00
133
转载 自然语言处理中文 工具包
1.Java自然语言处理 LingPipe LingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Spe...
2016-06-15 11:04:00
189
转载 nltk-比较中文文档相似度-完整实例
nltk同时也能处理中文的场景,只要做如下改动: 使用中文分词器(如我选用了结巴分词) 对中文字符做编码处理,使用unicode编码方式 python的源码编码统一声明为 gbk 使用支持中文的语料库 代码如下,需要jieba的支持 #!...
2016-06-15 11:04:00
210
转载 纽约大学Yann LeCun深度学习
纽约大学Yann LeCun深度学习3小时教学PPT,浓缩几十年研究神经网络的精华 http://www.cs.nyu.edu/~yann/talks/lecun-ranzato-icml2013.pdf ...
2016-06-15 11:04:00
264
转载 自然语言处理(NLP)概念浅析及国内外学习资料盘点
转载自:http://mp.weixin.qq.com/s?__biz=MzIyOTA2NTY0Nw==&mid=410685916&idx=1&sn=030197cee41b3204b9a434269941e0a9&scene=...
2016-06-15 11:03:00
39
转载 理解LSTM网络
理解LSTM网络 周期神经网络(Recurrent Neural Networks) 人类并非每一秒都在从头开始思考问题。当你阅读这篇文章时,你是基于之前的单词来理解每个单词。你并不会把所有内容都抛弃掉,然后从头开始理解。你的思考具有持久性。 传统的神经网络并不能做到这一点,...
2016-06-15 11:03:00
129
转载 机器学习算法基础概念学习总结
1.基础概念: (1) 10折交叉验证:英文名是10-foldcross-validation,用来测试算法的准确性。是常用的测试方法。将数据集分成10份。轮流将其中的9份作为训练数据,1分作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差...
2016-06-15 11:03:00
83
转载 确定windows操作系统的默认编码格式
问:怎么看当前 windows操作系统的默认编码格式? 答:在Windows平台下,进入DOS窗口,输入:chcp 可以得到操作系统的代码页信息,你可以从控制面板的语言选项中查看代码页对应的详细的字符集信息。 例如: 我的活动代码页为:936,它对于的编码格式为GBK 活动代码页对应...
2016-06-15 11:03:00
64
转载 人工神经网络入门(2) —— 人工神经基本概念介绍
如果您有疑问,可以先参考FAQ 如果您未找到满意的答案,可以在下面留言:) 首先向大家道歉,很长时间没有来更新文章了。最近杂事太多,不好意思。 1 介绍 在上一篇文章中,我们已经看到了一个简单的关于ANN实际应用程序,这篇文章中,我将简单地介绍一下ANN的最最基础的知识以及上一篇文...
2016-06-15 11:03:00
89
转载 机器学习算法汇总:人工神经网络、深度学习及其它
机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。 学习方式 根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,...
2016-06-15 11:03:00
117
转载 java.util.concurrent.ExecutionException: java.lang.OutOfMemoryError: Java heap space
严重: A child container failed during startjava.util.concurrent.ExecutionException: java.lang.OutOfMemoryError: Java heap space at java.util.concur...
2016-06-15 11:03:00
461
转载 文本挖掘
什么是文本挖掘 文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。1998年底,国家重点研究发展规划首批实施项目中明确指出,文本挖掘是“图像、语言、自然语言理解与知识挖掘”中的重要内容。 文本挖掘是信息挖掘的一个研究分支,用...
2016-06-15 11:03:00
195
转载 Theano学习笔记(一)——代数
标量相加 import theano.tensor as Tfrom theano import functionx = T.dscalar('x')y = T.dscalar('y')z = x + yf = function([x, y], z) 输入定义两个符号变量来代替数...
2016-06-15 11:03:00
136
转载 bad interpreter: No such file or directory
原因是.sh脚本在windows系统下用记事本文件编写的。不同系统的编码格式引起的。 转行文件的编码格式: 1、确保用户对文件有读写及执行权限 oracle@linux-106:~/RMAN/bin> chmod a+x test.sh 2、然后修改文件格式 (1)使用v...
2016-06-15 11:03:00
91
转载 特征选择(一)-维数问题与类内距离
什么是特征选择? 简单说,特征选择就是降维。 特征选择的任务 就是要从n维向量中选取m个特征,把原向量降维成为一个m维向量。但是降维必须保证类别的可分离性或者说分类器的性能下降不多。 注意降维具有片面性,算法并不普适。常常会有失效发生。 降维这件小事 在图像处理中...
2016-06-15 11:03:00
194
转载 自然语言处理(NLP)网上资源整理
最近把一些在网上见到的自然语言处理的资源整理了一下,包括论文列表、软件资源和一些实验室主页、个人主页等,希望能对NLP研究者有所帮助,由于个人视野有限,目前只整理了这些,以后会持续更新。在此也感谢这些资源的提供者和维护者。 论文、博客 1.Google在研究博客中总...
2016-06-15 11:03:00
79
转载 十一行Python代码实现一个神经网络(第一部分)
0.写在翻译之前 本文翻译自博客:i am trask, 属于本人一边学习神经网络一边翻译的文章。所以不止在翻译层面可能会有错误,在对神经网络的原理层面也难免会有错误。假如您发现哪里有问题,希望能谅解并留言可以让我修改,谢谢。 1.概要 一个能够玩的转的...
2016-06-15 11:03:00
91
转载 亿级Web系统搭建——单机到分布式集群(1)
大规模流量的网站架构,从来都是慢慢“成长”而来。而这个过程中,会遇到很多问题,在不断解决问题的过程中,Web系统变得越来越大。并且,新的挑战又往往出现在旧的解决方案之上。希望这篇文章能够为技术人员提供一定的参考和帮助。 以下为原文 当一个Web系统从日访问量10万逐步增长到1000万,...
2016-06-15 11:03:00
44
转载 入门句法分析
入门句法分析 FudanNLP 提供了依存句法分析功能。对应的类为 edu.fudan.nlp.parser.dep.JointParser。FudanNLP 的依存关系类型包括:核心词、主语、补语、宾语、定语、状语、并列、同位语、数量、介宾、连动、疑问连动、兼语、关联、重...
2016-06-15 11:03:00
69
转载 gensim-5个学习阶段
阶段1--语料库和向量 http://radimrehurek.com/gensim/tut1.html * 建立语料库步骤 1.从字符串==>向量 2.去除停用词;去除出现次数=1的词; 3.(对英文)小写化处理;词干化处理 ...
2016-06-15 11:03:00
77
转载 神经网络训练中的训练集、验证集以及测试集合
1:在NN训练中我们很常用的是训练集合以及测试集合,在训练集合上训练模型(我个人认为模型就是训练的方法以及对应的参数值,更偏重于参数值吧),训练好之后拿到测试集合上验证模型的泛华(就是该模型可以拿去实战的效果)的能力。 2:但是对于上述情况,举个例子,比如是在训练一个多层网络,我们用类...
2016-06-15 11:03:00
1079
转载 利用Theano理解深度学习——Multilayer Perceptron
一、多层感知机MLP 1、MLP概述 对于含有单个隐含层的多层感知机(single-hidden-layer Multi-Layer Perceptron, MLP),可以将其看成是一个特殊的Logistic回归分类器,这个特殊的Logistic回归分类器首先通过一个非线性变换 Φ (no...
2016-06-15 11:03:00
115
转载 Python语言下的机器学习库
Python是最好的编程语言之一,在科学计算中用途广泛:计算机视觉、人工智能、数学、天文等。它同样适用于机器学习也是意料之中的事。 当然,它也有些缺点;其中一个是工具和库过于分散。如果你是拥有unix思维(unix-minded)的人,你会觉得每个工具只做一件事并且把它做好是非常方便的。但是...
2016-06-15 11:03:00
112
转载 Stanford CoreNLP开源项目的3种编译和运行方式[2]
4.项目源码在linux控制台下的编译与运行 第3节中所述的操作其实已经可以满足大部分程序员的要求了。但是还有一小部分程序员,他们要把项目打好jar包部署到linux的服务器上。 部署的过程中有可能要在linux服务器上当场改代码。这时候有两种解决方式: 1.返回开发环境,...
2016-06-15 11:03:00
136
转载 机器学习算法基础概念学习总结
1.基础概念: (1) 10折交叉验证:英文名是10-fold cross-validation,用来测试算法的准确性。是常用的测试方法。将数据集分成10份。轮流将其中的9份作为训练数据,1分作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的...
2016-06-15 11:03:00
45
转载 机器学习资源精华-整理收藏
整理收藏的机器学习的大量相关资源,包括开源软件包、基础数据集、以及论文集。 http://m.sciencemag.org/site/feature/data/compsci/machine_learning.xhtml ...
2016-06-15 11:03:00
81
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人