自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(64)
  • 收藏
  • 关注

转载 2017双十一珠峰算法框架&Hierarchical中控算法

https://yq.aliyun.com/articles/5516982017双十一珠峰算法框架&Hierarchical中控算法13542591470328102018-03-19 10:25:52浏览3697评论0大数据 算法 函数 供应链 流量调控 商业平台摘要:一.背景 2017珠峰项目是阿里巴巴集团在双十一战略决策...

2019-05-20 09:30:08 2300

转载 计算广告系统算法与架构综述

知识登录探索知识产业专栏AI商用搜索达观数据原创2019/04/01 15:15吴威骏作者计算广告系统算法与架构综述前言我们当今身处一个被广告包围的时代,无论是走在马路上、收看电视剧、或者是玩手机游戏,都能看见形形色色的广告。随着时代和技术的发展,广告的形式呈现出多样化、立体化的趋势,从最早的纸媒广告发展到如今的网页的展示、搜索广...

2019-05-13 11:12:48 2685

转载 Deep Residual Network 与 梯度消失

https://blog.csdn.net/supercally/article/details/556710641. 什么是DRN,为什么需要DRNDRN的全称是Deep Residual Network,深度残差网络,是对普通的深度学习网络的一种改进。我们为什么需要深度残差网络呢?因为普通的深度学习网络存在着这样的问题在层数比较少的时候,我们增加网络的深度,可以获得更好的表达效果...

2019-02-21 10:15:44 417

转载 Serving Google BERT in Production using Tensorflow and ZeroMQ

Serving Google BERT in Production using Tensorflow and ZeroMQJan 2, 2019 by     Han Xiao - Engineering Lead @ Tencent AI Lab◷    24 min readThis is a post explaining the design philosphy behind ...

2019-02-15 16:38:48 1297

转载 SVM对偶问题

http://www.hanlongfei.com/convex/2015/11/05/duality/http://www.hanlongfei.com/convex/2015/11/08/kkt/

2019-01-28 17:20:01 303 1

转载 Word embeddings in 2017: Trends and future directions

http://ruder.io/word-embeddings-2017/index.html?utm_campaign=Artificial%25252525252BIntelligence%25252525252BWeekly&utm_medium=web&utm_source=Artificial_Intelligence_Weekly_72Word embeddings...

2019-01-28 10:45:09 764

转载 NLP的巨人肩膀

https://zhuanlan.zhihu.com/p/50443871首发于PaperWeekly关注专栏写文章 NLP的巨人肩膀weizier​关注他314 人赞了该文章我们都知道,牛顿说过一句名言If I have seen further, it is by standing on the shoulders of giants.无可否...

2018-12-27 16:27:18 1688

转载 NLP突破性成果 BERT 模型详细解读

https://zhuanlan.zhihu.com/p/46997268NLP突破性成果 BERT 模型详细解读章鱼小丸子不懂算法的产品经理不是好的程序员​关注她82 人赞了该文章Google发布的论文《Pre-training of Deep Bidirectional Transformers for Language Understanding》,提到的BERT...

2018-12-12 16:50:56 2496

转载 注意力机制(Attention Mechanism)在自然语言处理中的应用

注意力机制(Attention Mechanism)在自然语言处理中的应用    近年来,深度学习的研究越来越深入,在各个领域也都获得了不少突破性的进展。基于注意力(attention)机制的神经网络成为了最近神经网络研究的一个热点,本人最近也学习了一些基于attention机制的神经网络在自然语言处理(NLP)领域的论文,现在来对attention在NLP中的应用进行一个总结,和大家一起分享...

2018-11-05 16:30:07 395

转载 Is That a Duplicate Quora Question?

https://www.linkedin.com/pulse/duplicate-quora-question-abhishek-thakur TL;DR : I achieved near state-of-the-art accuracy by using a very deep neural net. The code is available here: https://githu...

2018-08-16 15:28:53 389

转载 从Kaggle赛题: Quora Question Pairs 看文本相似性/相关性

从Kaggle赛题: Quora Question Pairs 看文本相似性/相关性包大人健身 Kaggle 自然语言处理 数据挖掘137 人赞了该文章从Kaggle赛题: Quora Question Pairs 看文本相似性/相关性今天来复盘一下9个月前的Kaggle: Quora Question Pairs, 也算是对文本相似性工作的一点总结,Quora赛题是我接触数据竞赛的第一次比赛,正...

2018-06-26 15:37:41 4051

转载 Deep Reinforcement Learning: Pong from Pixels

Andrej Karpathy blogAbout Hacker's guide to Neural NetworksDeep Reinforcement Learning: Pong from PixelsMay 31, 2016This is a long overdue blog post on Reinforcement Learning (

2018-01-12 14:43:12 678

转载 A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)

本文是对 http://mnemstudio.org/path-finding-q-learning-tutorial.htm 的翻译,共分两部分,第一部分为中文翻译,第二部分为英文原文。翻译时为方便读者理解,有些地方采用了意译的方式,此外,原文中有几处笔误,在翻译时已进行了更正。这篇教程通俗易懂,是一份很不错的学习理解 Q-learning 算法工作原理的材料。第一

2018-01-11 19:10:05 360

转载 从2017年顶会论文看 Attention Model

从2017年顶会论文看 Attention Model阅读 107收藏 52017-10-11原文链接:zhuanlan.zhihu.com腾讯云域名限量秒杀中!.com低至28元,.club最低1元!立即了解详情抢购吧!https://dnspod.cloud.tencent.com/act/yearendsales前言:2017年KDD,

2018-01-03 16:20:44 1145

原创 欧氏距离与马氏距离

Preface  之前在写《Multi-view CNNs for 3D Objects Recognition》的阅读笔记的时候,文章中的一个创新点便是将MVCNN网络提取到的3D Objects的形状特征描述符,投影到马氏距离(Mahalanobis Distance)上,“这样的话,相同类别3D形状之间的ℓ2距离在投影后的空间中就更小,而不同的类别之间的ℓ2在投影后会更大”,也更

2017-12-29 17:06:18 1899

转载 【机器学习详解】SMO算法剖析

转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/51227754 CSDN−勿在浮沙筑高台本文力求简化SMO的算法思想,毕竟自己理解有限,无奈还是要拿一堆公式推来推去,但是静下心看完本篇并随手推导,你会迎刃而解的。推荐参看SMO原文中的伪代码。1.SMO概念上一篇博客已经详细介绍了SV

2017-12-22 17:02:33 336

转载 支持向量机原理(二) 线性支持向量机的软间隔最大化模型

支持向量机原理(一) 线性支持向量机    支持向量机原理(二) 线性支持向量机的软间隔最大化模型    支持向量机原理(三)线性不可分支持向量机与核函数    支持向量机原理(四)SMO算法原理    支持向量机原理(五)线性支持回归   在支持向量机原理(一) 线性支持向量机中,我们对线性可分SVM的模型和损失函数优化做了总结。最后我们提到了有时候不能线

2017-12-19 14:07:03 758

转载 http://www.jianshu.com/p/55458caf0814

用讲故事的办法帮你理解SMO算法http://www.jianshu.com/p/55458caf0814

2017-12-19 09:54:28 1258

转载 支持向量机原理(四)SMO算法原理

支持向量机原理(一) 线性支持向量机    支持向量机原理(二) 线性支持向量机的软间隔最大化模型    支持向量机原理(三)线性不可分支持向量机与核函数    支持向量机原理(四)SMO算法原理    支持向量机原理(五)线性支持回归   在SVM的前三篇里,我们优化的目标函数最终都是一个关于αα向量的函数。而怎么极小化这个函数,求出对应的αα向量

2017-12-18 14:59:51 347

原创 SVM相关问题

1. 什么情况下是强对偶关系。convex primal(原问题目标函数是凸问题),feasible primal(原问题可解),linear constraints(线性的约束)    这里只是给出了强对偶关系的结论,具体证明方法未给出    SVM满足以上的3个条件,是强对偶关系,直接用对偶问题的解作为原始问题的解即可

2017-12-15 17:49:04 213

转载 基于互信息和左右信息熵的短语提取识别

在中文语言处理领域,一项重要的任务就是提取中文短语,也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐,新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语,并给出原理和步骤。开源项目本文代码已集成到HanLP中开源:http://www.hankcs.com/nlp/hanlp.html测试数据算法工程师算法(Algorithm)是一

2017-12-15 16:27:25 1861 1

转载 拉格朗日对偶

本文承接上一篇 约束优化方法之拉格朗日乘子法与KKT条件,将详解一些拉格朗日对偶的内容。都是一些在优化理论中比较简单的问题或者一些特例,复杂的没见过,但是简单的刚接触都感觉如洪水猛兽一般,所以当真是学海无涯。在优化理论中,目标函数 f(x)f(x) 会有多种形式:如果目标函数和约束条件都为变量 xx 的线性函数, 称该问题为线性规划; 如果目标函数为二次函数, 约束条件为线性函数, 称

2017-12-15 16:21:25 208

转载 约束优化方法之拉格朗日乘子法与KKT条件

约束优化方法之拉格朗日乘子法与KKT条件引言本篇文章将详解带有约束条件的最优化问题,约束条件分为等式约束与不等式约束,对于等式约束的优化问题,可以直接应用拉格朗日乘子法去求取最优值;对于含有不等式约束的优化问题,可以转化为在满足 KKT 约束条件下应用拉格朗日乘子法求解。拉格朗日求得的并不一定是最优解,只有在凸优化的情况下,才能保证得到的是最优解,所以本文称拉格朗日乘子

2017-12-15 16:07:55 290

转载 支持向量机SVM(二)

支持向量机SVM(二)【转载请注明出处】http://www.cnblogs.com/jerrylead6 拉格朗日对偶(Lagrange duality)     先抛开上面的二次规划问题,先来看看存在等式约束的极值问题求法,比如下面的最优化问题:            目标函数是f(w),下面是等式约束。通常解法是引入拉格朗日算子,这里使用来表示算子,得到拉格朗日公

2017-12-14 17:17:35 228

原创 棋类AI相关

http://blog.csdn.net/fsdev/article/category/1085675象棋百科全书http://www.xqbase.com/computer.htm

2017-12-13 10:38:51 704

转载 12 papers to understand QA system with Deep Learning

http://blog.csdn.net/abcjennifer/article/details/51232645由于最近入手NLP任务,需要看一些paper,本文对最近两周看的paper做个总结,适用于有deep learning背景,希望了解NLP应用的同学,主要针对NLP方向: 问答系统(QA)和翻译(Machine Translation)。本文提到的12篇paper比较有代表性,

2017-12-13 10:35:01 232

转载 搜索引擎的Query自动纠错技术和架构详解

http://www.52nlp.cn/%E8%BE%BE%E8%A7%82%E6%95%B0%E6%8D%AE%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E7%9A%84query%E8%87%AA%E5%8A%A8%E7%BA%A0%E9%94%99%E6%8A%80%E6%9C%AF%E5%92%8C%E6%9E%B6%E6%9E%84%E8%AF%A6%E8%

2017-12-13 10:34:35 8915

转载 QA相关的DL论文

http://aclweb.org/aclwiki/index.php?title=Question_Answering_(State_of_the_art)Question Answering (State of the art)Answer Sentence SelectionThe task of answer sentence sel

2017-12-13 10:34:00 754

转载 机器学习实践中应避免的七种常见错误

http://www.52cs.org/?p=879统计建模和工程开发很相似。在工程开发中,人们有多种方法搭建一套键-值存储系统,每种设计针对使用模式有一套不同的假设。在统计建模中,也有很多算法来构造一个分类器,每种算法对数据也有各自的假设集合。当处理少量数据时,因为实验成本很低,我们尽可能多的尝试各种算法,从而选出效果最优的算法。但提到“大数据”,提前分析数据,然后设计相

2017-12-13 10:33:25 196

原创 CNN QA(Question and Answer)问答的theano和tensorflow代码

https://github.com/white127/insuranceQA-cnn================result==================theano and tensorflow cnn code for insuranceQAtheano code, test1 top-1 precision : 61.5% (see ./insuran

2017-12-13 10:32:14 537

转载 An overview of gradient descent optimization algorithms

An overview of gradient descent optimization algorithmsTable of contents:Gradient descent variantsBatch gradient descentStochastic gradient descentMini-batch gradient d

2017-12-13 10:31:32 220

转载 深度学习教父Hinton专访,AI已跨越重要分水岭

http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2651983539&idx=1&sn=2c0861514b58765b6b3e3cfeba63c680&scene=2&srcid=0621jbS0TSHbj1BTB0WD7xTu&from=timeline&isappinstalled=0

2017-12-13 10:30:22 240

转载 Reinforcement Leaning资料

https://gym.openai.com/docs/rl基于gym的一个简单DQN代码实现https://zhuanlan.zhihu.com/p/21477488?refer=intelligentunit

2017-12-13 10:29:46 166

转载 互联网时代的社会语言学:基于SNS的文本数据挖掘

http://www.matrix67.com/blog/archives/5044Matrix67: The Aha Moments 十十十四是十四四十是四十十是十十四是十四四十是四十十是四十十四是十四四十是四十十四四十是四十是十十四是十四四十是四十是十四四十是四十是四十是四十是十十四是十四四十是四十四十四十是十十四

2017-12-13 10:28:44 480

转载 最优化理论和支持向量机的对偶问题

http://jacoxu.com/?p=78http://blog.pluskid.org/?p=702

2017-12-12 14:52:34 392

转载 台大机器学习corsera资料

笔记中的公式全部采用LATEXLATEX语法手工输入,某些笔记由于公式数量太多,可能造成浏览器显示不正常,通常刷新下页面即可重新加载。若出现公式错误,麻烦您提醒我修正。笔记之前发布在我的博客当中beader.me,使用markdown撰写,因此几乎不加修改就转移到gitbook当中,可能会出现一些排版错误,也麻烦您提醒我修正。老师课堂讲义打包下载,有些地区的朋友访问coursera速度较慢,也

2017-12-12 14:51:08 561

转载 怎样提升机器学习:特征工程的奇淫巧技

目录 [显示]作者:Jacob Joseph系列名称:Improving analytics output with feature engineeringPart1: How to Improve Machine Learning: Tricks and Tips for Feature EngineeringPart2: Enhance Machine Lear

2017-12-12 14:50:38 373

转载 为什么在神经网络中要使用交叉熵而不是均方差作为损失函数

https://jamesmccaffrey.wordpress.com/2013/11/05/why-you-should-use-cross-entropy-error-instead-of-classification-error-or-mean-squared-error-for-neural-network-classifier-training/James D.

2017-12-12 14:50:11 3931

转载 第五章 深度神经网络为何很难训练

http://www.jianshu.com/p/917f71b06499

2017-12-12 14:49:40 210

转载 最小二乘、ridge、lasso的概率论原理

最小二乘、ridge、lasso的概率论原理 https://www.zhihu.com/question/20447622

2017-12-12 14:49:08 1322

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除