自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

翻译 深度学习在 NLP 上的实践

自然语言处理的一些新技术的应用

2017-07-28 18:11:05 2585

原创 用代码聊算法之k-means算法

一、简介k-means是一种常见的无监督机器学习算法,众所周知,无监督学习的分类往往是需要先聚类再分类的,而k-means算法就是最常见,使用频率最高的聚类算法。其核心思想是把一些未标注的数据(无标签)分类称为k类不相同的簇中(cluster),算法k-means名称中的k就是所分成的簇的数量。而同一簇之中的对象都是有某些相似之处,当簇中的点越相似,我们的分类效果就越好。每个簇的中心点是由该簇

2017-06-08 20:18:17 995

原创 ElasticSearchDSL查询模板之二(二重聚合)

前一篇文章中分享了按日期聚合和按关键字聚类的方法,可以查询一段时期的所有数据中,每一天有多少数据,每一个类别有多少数据。但是实际应用之中,业务场景往往更加复杂,一般情况这种聚合都是不够的,例如需要看某一天某种类的销售数据,某个类别下所有所选日期的数据,这就需要在之前聚类的基础上进行二次聚类。另外推荐大家一个软件,postman,可以利用这个软件直接写json,模拟真实的http/https请求环境

2017-06-04 16:03:18 892

原创 ElasticSearchDSL查询模板之一(按日查询与按关键词聚类)

最近工作忙得紧,又开始设计用户画像项目,又要做需求,所以博客有一段时间没有更新了,今天刚写完了一大波需求,所以也就抽出一点时间分享一些DSL在开源这些方法对最开始,先定义几个全局变量,后面对方法中会用到:private static final StringSELECT_FORMAT = "%s/%s/%s/_search";privatestati

2017-04-18 17:34:46 5188 3

原创 ElasticSearch基本查询工具

众所周知,ElastcSearch支持通过http请求通过传输json的方式进行复杂查询,包括聚类、分类或是去重这些操作都可以通过ElasticSearch底层的Lucene来完成(关于Lucene的部分不在今天讨论范围,如果想进一步了解请移步Lucene源码)。言归正传,talk is cheap ,let's see the code:一、工具类      首先写一个流文件转but

2017-03-23 11:28:14 2092

翻译 神经网络和深度学习简史(四)

“问问机器学习从业者,究竟是什么还在维持着奄奄一息的神经网络?你可能会听到以下三个人名中的一个:Geoffrey Hinton,加拿大的Yoshua Bengio,或是Facebook的Yann LeCun。”一、深度学习计划        当你想要发动一场革命,你就要从阴谋开始。随着支持向量机(SVM)的成功以及反向传播的失败,神经网络的研究在21世纪迎来了黑暗时期。Le

2017-02-07 16:33:13 2831

翻译 神经网络和深度学习简史(三)

一、可以做决定的神经网络        在了解了神经网络在无监督学习方面的应用以后,我们接下来将见到机器学习的第三部分:强化学习。尽管这个概念需要一个明确的数学表示进行描述,但我们可以先从简单理解一下:强化学习可以帮助我们作出决定。有一些理想的代理(例如一个小程序),这些代理可以基于其当前的状态来决定当下的动作,并且可以在每个动作之后得到相应的回馈,而决策的依据就是使长期优势最大化。因

2017-02-04 09:41:21 3178

翻译 神经网络和深度学习简史(二)

一、神经网络与计算机视觉图2.1 Yann LeCun和他的LeNet描述        随着训练多层神经网络的秘密被揭开,神经网络再一次回到了学术界的面前,Rosenblatt的梦想似乎也正变得唾手可得。直到1989年,一个重要的发现被提出来了,那就是“多层前馈网络是一种通用的逼近器”,直至今日,这一发现仍被广大教科书和讲座中被普遍引用着。可以从数学角度证明,多层

2017-02-03 18:05:33 1390

翻译 神经网络和深度学习简史(一)

“深度学习这一朵浪花在计算机语言学的海上已经被研究了多年,但2015年似乎有一股海啸般的力量把自然语言处理(NLP)推到了世人面前”-----------Dr. Christopher D. Manning, Dec 2015 科研某一个领域的所有已知方法被一种突如其来新发现而完全取代,如同被“海啸”袭击了一样,这听起来像是一个奇异的故事。然而这种灾难性的比喻用来形容近几年的深度学习再恰当不过

2017-01-25 15:03:30 5881 2

原创 【菜鸟小屁的成长日记】之<ElasticSearch中的TimeStamp时间戳>篇

在接触到ElasticSearch的过程当中发现了ElasticSearch里面非常麻烦的一个field,就是时间格式。Elastic本身有一种特殊的时间格式,其形式如"2016-01-25T00:00:00",此格式为ISO8601标准。具体时间日期格式要求可以参见es官方文档。而这个field我们可以通过返回JSON中的get()方法取出,取出值是一个String类型的日期。然而我们在计算

2017-01-24 11:45:37 15244 2

原创 【菜鸟小屁的成长日记】之ElasticSearchElasticsearch<入门>篇

一、Elastic Search的优缺点Elasticsearch是一个实时分布式搜索和分析引擎。它拥有如下的优点:1、ElasticSearch是一个实时分布式搜索和分析引擎擅,擅长处理大规模的数据。在面对海量数据时,性能会有显著提升。而这是因为Elasticsearch是面向文档(document oriented)的,这意味着它可以存储整个对象或文档(document)。然而

2017-01-13 21:33:56 463

原创 菜鸟小屁的成长日记2017.1.12

正当我搭好环境变量,电脑竟然坏了,浪费了一上午,终于可以补上昨天的学习日记昨天看源码看到接近11点,也就忘了写日记这回事,难道以后的日记都要第二天写了吗?总结一下1.12号学到的知识:1 JSON的本质只有两种东西,{}的都是JsonObject,[]的都是JsonArray。   通过com.google.gson的三个包[JsonArray,JsonObject,JsonEle

2017-01-13 17:52:30 291

原创 菜鸟小屁的成长日记2017.1.11

昨天老大交给我了任务,忙到10点半才下班,也就没有时间写日记,特此补上。让一个实习生看了一天的框架就开始接手项目,我也是蛮慌的。我只看了框架结构,连文档都没有看全,就要独立设计项目了,我的内心其实是崩溃的,幸好老大会指给我一些方向性的建议,不然就真的哭了。对于项目的实现方法,一开始想错了方向,把云计算的内容下载到本地服务器计算是万万不对的。这样当数据量大的时候,本地服务器可能就跪了。越

2017-01-12 11:26:15 342

原创 菜鸟小屁的成长日记2017.1.10

经历了昨天一上午的入职培训以及签约等忙碌,下午又与mac mini进行了激烈的战争,今天总算是稳定了下来,开始了新一段的实习。从今天开始记录我的实习经历,以期作为成长路上的一点印记,希望对自己或有缘看到的人有所裨益。首先对公司对第一印象就是高大上,公司的产品是很酷炫的,办公环境也可以看出来与众不同。因此能够得到这次实习机会,我自然也是十分兴奋的。在实习第一天就发现与我的室友健哥在一个办

2017-01-10 20:35:51 387

转载 A 'Brief' History of Neural Nets and Deep Learning, Part 4

原文作者为andreykurenkov.本文系转载,仅供各位深度学习爱好者学习使用。“Ask anyone in machine learning what kept neural network research alive and they will probably mention one or all of these three names: Geoffrey Hinto

2016-10-27 19:03:45 1350

转载 A 'Brief' History of Neural Nets and Deep Learning, Part 3

Neural Nets Make Decisions原文作者为andreykurenkov.本文系转载,仅供各位深度学习爱好者学习使用。Having discovered the application of neural nets to unsupervised learning, let us also quickly see how they were used in the t

2016-10-27 19:01:13 705

转载 A 'Brief' History of Neural Nets and Deep Learning, Part 2

Neural Nets Gain Vision原文作者为andreykurenkov.本文系转载,仅供各位深度学习爱好者学习使用。Yann LeCun's LeNet demonstrated.With the secret to training multilayer neural nets uncovered, the topic was once again em

2016-10-27 18:59:08 528

转载 A 'Brief' History of Neural Nets and Deep Learning, Part 1

Prologue: The Deep Learning Tsunami“Deep Learning waves have lapped at the shores of computational linguistics for several years now, but 2015 seems like the year when the full force of the tsunam

2016-10-27 17:23:47 874

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除