算法
云淡风清的Coding
这个作者很懒,什么都没留下…
展开
-
倒排文件
1.倒排文件的组织方式和特点 倒排文件和多重表文件不同。在次关键字索引中,具有相同次关键字的记录之间不进行链接,而是列出具有该次关键字记录的物理地址。 倒排文件中的次关键字索引称做倒排表。倒排表和主文件一起就构成了倒排文件。2.倒排文件的查询 倒排表的主要优点是:在处理复杂的多关键字查询时,可在倒排表中先完成查询的交、并等逻辑运算,得到结果后再对记录进行存取。这样不必对每原创 2017-07-20 08:12:53 · 4370 阅读 · 0 评论 -
谷歌翻译整合神经网络:机器翻译实现颠覆性突破
选自Google Research作者:Quoc V. Le、Mike Schuster机器之心编译 参与:吴攀昨日,谷歌在 ArXiv.org 上发表论文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》介绍谷歌的神经机器翻译系统(GNMT),当日...转载 2018-03-22 10:08:05 · 5450 阅读 · 0 评论 -
从冷战到深度学习:一篇图文并茂的机器翻译史
作者:Ilya Pestov英语版译者:Vasily Zubarev中文版译者:Panda实现高质量机器翻译的梦想已经存在了很多年,很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译,机器翻译的水平不断提升,已经能满足很多场景的基本应用需求了。近日,Ilya Pestov 用俄语写的机器翻译介绍文章经 Vasily Zubarev 翻译后发表到了 ...转载 2018-03-22 10:00:31 · 1323 阅读 · 0 评论 -
微软人工智能又一里程碑:微软中-英机器翻译水平可“与人类媲美”
继在语音识别和机器阅读领域取得的“过人”成绩,由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队今天宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,达到了可与人工翻译媲美的水平。这是首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统。跨时区跨领域合作,四大技术为创新加持虽然学术界和产业界的科研人员致力于机器翻译研究很多年,但近两年深度神经网络的使用...转载 2018-03-22 09:24:13 · 383 阅读 · 0 评论 -
百度、谷歌搜索引擎原理
第一节 搜索引擎原理1、基本概念 来源于中文wiki百科的解释:(网络)搜索引擎指自动从互联网搜集信息,经过一定整理以后,提供给用户进行查询的系统。 来源于英文wiki百科的解释:Web search engines providean interface to search for information on the World WideWeb.Information may c...转载 2017-07-20 08:13:46 · 16882 阅读 · 2 评论 -
十种排序算法介绍(上)
出自matrix67.com 今天我正式开始按照我的目录写我的OI心得了。我要把我所有学到的OI知识传给以后千千万万的OIer。以前写过的一些东西不重复写了,但我最后将会重新整理,使之成为一个完整的教程。 按照我的目录,讲任何东西之前我都会先介绍时间复杂度的相关知识,以后动不动就会扯到这个东西。这个已经写过了,你可以在这里看到那篇又臭又长的文章。在讲排序算法的过程中,我们将始终围绕时间复杂度...转载 2017-07-20 08:13:52 · 343 阅读 · 0 评论 -
十种排序算法介绍(中)
出自matrix67.com 本文被华丽的分割线分为了四段。对于O(nlogn)的排序算法,我们详细介绍归并排序并证明归并排序的时间复杂度,然后简单介绍堆排序,之后给出快速排序的基本思想和复杂度证明。最后我们将证明,O(nlogn)在理论上已经达到了最优。学过OI的人一般都学过这些很基础的东西,大多数OIer们不必看了。为了保持系列文章的完整性,我还是花时间写了一下。 首先考虑一个简单的问题...转载 2017-07-20 08:13:54 · 348 阅读 · 0 评论 -
十种排序算法介绍(下)
出自matrix67.com 那么,有什么方法可以不用比较就能排出顺序呢?借助Hash表的思想,多数人都能想出这样一种排序算法来。 我们假设给出的数字都在一定范围中,那么我们就可以开一个范围相同的数组,记录这个数字是否出现过。由于数字有可能有重复,因此Hash表的概念需要扩展,我们需要把数组类型改成整型,用来表示每个数出现的次数。 看这样一个例子,假如我们要对数列3 1 4 1 5 9...转载 2017-07-20 08:13:57 · 298 阅读 · 0 评论 -
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络下
4激活函数建立一个神经网络时,需要关心的一个问题是,在每个不同的独立层中应当采用哪种激活函数。逻辑回归中,一直采用sigmoid函数作为激活函数,此外还有一些更好的选择。tanh函数(Hyperbolic Tangent Function,双曲正切函数)的表达式为:函数图像为:tanh函数其实是sigmoid函数的移位版本。对于隐藏单元,选用tanh函数作为激活函数的话,效果总比sigmoid函数...转载 2018-03-20 15:04:35 · 478 阅读 · 0 评论 -
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上
神经网络(Neural Network)的构筑理念是受到生物神经网络功能的运作启发而产生的。人工神经网络通常是通过一个基于数学统计学类型的学习方法得以优化,所以人工神经网络也是数学统计学方法的一种实际应用。和其他机器学习方法一样,神经网络已经被用于解决各种各样的问题,例如机器视觉和语音识别,这些问题都是很难被传统基于规则的编程所解决的。1神经网络机器学习领域所说的神经网络指的是一种模仿生物神经网络...转载 2018-03-20 14:55:14 · 441 阅读 · 0 评论 -
【吴恩达Deeplearning.ai笔记一】直观解释逻辑回归
深度学习(Deep Learning)是机器学习(Machine Learning)的一大分支,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。逻辑回归(Logistic Regression,也译作“对数几率回归”)是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。1符号约定逻辑回归...转载 2018-03-20 11:18:03 · 2751 阅读 · 1 评论 -
向量空间模型(VSM)
向量空间模型将文档映射为一个特征向量V(d)=(t1,ω1(d);…;tn,ωn(d)),其中ti(i=1,2,…,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值,一般被定义为ti在d中出现频率tfi(d)的函数,即 。在信息检索中常用的词条权值计算方法为 TF-IDF 函数,其中N为所有文档的数目,ni为含有词条ti的文档数目。TF-IDF公式有很多变种,下面是一个常用的T原创 2017-07-20 08:12:50 · 926 阅读 · 0 评论 -
人工智能之GAN算法
不管何种模型,其损失函数(Loss Function)选择,将影响到训练结果质量,是机器学习模型设计的重要部分。对于判别模型,损失函数是容易定义的,因为输出的目标相对简单。但对于生成模型,损失函数却是不容易定义的。2014年GoodFellow等人发表了一篇论文“Goodfellow, Ian, et al. Generative adversarial nets." Advances inNeu...转载 2018-07-02 09:56:44 · 22583 阅读 · 0 评论