自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

寒小阳

专注机器学习/数据挖掘

原创 “ML学分计划”说明书

##计划的由来## 我们是一群对机器学习感兴趣的小伙伴,对于神奇的机器学习经常有“一探究竟”的冲动,却因为孤身一人学习的寂寞、亦或繁忙考试工作之余的小小拖延症,而没有持续这份对知识的渴求和热情。 由于深感类似情况的小伙伴之多,我们希望建立一个“ML学分计划”——机器学习的学习和分享计划——来帮助我...

2015-11-04 00:20:00

阅读数 28529

评论数 37

原创 NLP系列(10)_词向量之图解Word2vec

审校:龙心尘 作者:Jay Alammar 编译:张秋玥、毅航、高延 https://blog.csdn.net/longxinchen_ml/article/details/89077048 原文链接: https://jalammar.github.io/illustrated-word2ve...

2019-04-08 09:58:35

阅读数 24589

评论数 1

原创 NLP系列(9)_深入理解BERT Transformer ,不仅仅是注意力机制

大数据文摘与百度NLP联合出品 作者:Damien Sileo 审校:百度NLP、龙心尘 编译:张驰、毅航 https://blog.csdn.net/longxinchen_ml/article/details/89058309 原文链接: https://medium.com/synapse-...

2019-04-08 09:56:43

阅读数 1720

评论数 0

原创 NLP系列(8)_用可视化解构BERT,从上亿参数中提取出的6种直观模式

大数据文摘联合百度NLP出品 审校:百度NLP、龙心尘 编译:Andy,张驰 来源:towardsdatascience.com https://blog.csdn.net/longxinchen_ml/article/details/89036531 编者按: 深度神经网络的超强有效性一直让人疑...

2019-04-08 09:54:32

阅读数 1178

评论数 0

原创 NLP系列(7)_Transformer详解

审校:百度NLP、龙心尘 翻译:张驰、毅航、Conrad 原作者:Jay Alammar 原链接:https://jalammar.github.io/illustrated-transformer/ 编者按:前一段时间谷歌推出的BERT模型在11项NLP任务中夺得SOTA结果,引爆了整个NLP界...

2019-01-20 11:29:23

阅读数 2912

评论数 3

原创 NLP系列(6)_从NLP反作弊技术看马蜂窝注水事件

作者: 龙心尘 时间:2018年11月 出处:https://blog.csdn.net/longxinchen_ml/article/details/84205459 按:本文基于网易云课堂公开课分享内容整理补充完成。感谢志愿者july同学的贡献。 10月21日,朋友圈被一篇名为《估值175亿的...

2018-11-18 22:06:00

阅读数 2804

评论数 2

原创 从FM推演各深度学习CTR预估模型(附代码)

作者: 龙心尘 && 寒小阳 时间:2018年7月。 出处:https://blog.csdn.net/longxinchen_ml/article/details/81031736 http:/...

2018-07-13 15:13:47

阅读数 9784

评论数 11

原创 全球名校课程作业分享系列(11)--斯坦福CS231n之生成对抗网络

课程作业原地址:CS231n Assignment 3 作业及整理:@邓姸蕾 && @Molly && @寒小阳 时间:2018年2月。 出处:http://blog.csdn.net/han...

2018-02-12 14:23:23

阅读数 4666

评论数 2

原创 全球名校课程作业分享系列(10)--斯坦福CS231n之Network visualization

课程作业原地址:CS231n Assignment 3 作业及整理:@邓姸蕾 && @Molly && @寒小阳 时间:2018年2月。 出处:http://blog.csdn.net/han...

2018-02-12 14:20:18

阅读数 4776

评论数 0

原创 全球名校课程作业分享系列(9)--斯坦福CS231n之RNN与计算机看图说话

课程作业原地址:CS231n Assignment 3 作业及整理:@张礼俊 && @Molly && @寒小阳 时间:2018年2月。 出处:http://blog.csdn.net/han...

2018-02-12 14:05:12

阅读数 3887

评论数 2

原创 全球名校课程作业分享系列(8)--斯坦福计算机视觉与深度学习CS231n之tensorflow实践

课程作业原地址:CS231n Assignment 1 作业及整理:@邓妍蕾 && @郭承坤 && @寒小阳 时间:2018年2月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/7927893...

2018-02-07 13:07:25

阅读数 5222

评论数 1

原创 全球名校课程作业分享系列(7)--斯坦福计算机视觉与深度学习CS231n之基于cifar10的卷积神经网络实践

课程作业原地址:CS231n Assignment 1 作业及整理:@张铮 && @郭承坤 && @寒小阳 时间:2018年2月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/79278917...

2018-02-07 13:04:27

阅读数 5834

评论数 0

原创 全球名校课程作业分享系列(6)--斯坦福计算机视觉与深度学习CS231n之神经网络细解与优化尝试

课程作业原地址:CS231n Assignment 1 作业及整理:编写:@土豆 && @郭承坤 && @寒小阳 时间:2018年2月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/79278...

2018-02-07 12:58:12

阅读数 7411

评论数 1

原创 全球名校课程作业分享系列(5)--斯坦福计算机视觉与深度学习CS231n之特征抽取与图像分类提升

课程作业原地址:CS231n Assignment 1 作业及整理:@邓妍蕾 && @Molly && @寒小阳 时间:2018年1月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/79140084...

2018-01-23 15:11:33

阅读数 11379

评论数 0

原创 全球名校课程作业分享系列(4)--斯坦福计算机视觉与深度学习CS231n之双层神经网络完成图像多分类

课程作业原地址:CS231n Assignment 1 作业及整理:@林凡莉 && @Molly && @寒小阳 时间:2018年1月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/79139395...

2018-01-23 14:28:56

阅读数 11403

评论数 0

原创 全球名校课程作业分享系列(3)--斯坦福计算机视觉与深度学习CS231n之softmax图像多分类

课程作业原地址:CS231n Assignment 1 作业及整理:@林凡莉 && @Molly && @寒小阳 时间:2018年1月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/79138352...

2018-01-23 13:06:58

阅读数 12145

评论数 3

原创 全球名校课程作业分享系列(2)--斯坦福计算机视觉与深度学习CS231n之SVM图像分类

课程作业原地址:CS231n Assignment 1 作业及整理:@谭斌 && @Molly && @寒小阳 时间:2018年1月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/70214565 ...

2018-01-23 12:58:12

阅读数 10671

评论数 0

原创 全球名校课程作业分享系列(1)--斯坦福计算机视觉与深度学习CS231n之KNN

课程作业原地址:CS231n Assignment 1 作业及整理:@郭承坤 && @Molly && @寒小阳 时间:2018年1月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/79138352...

2018-01-23 12:49:17

阅读数 12584

评论数 1

原创 机器学习系列(23)_SVM碎碎念part6:对偶和拉格朗日乘子

原文地址:SVM - Understanding the math - duality-lagrange-multipliers/ by Brandon Amos 感谢参与翻译同学:@Fox && @程超 && @吕征达 时间:2018年1月。 出处:ht...

2018-01-16 22:44:46

阅读数 7259

评论数 6

原创 机器学习系列(22)_SVM碎碎念part5:凸函数与优化

原文地址:SVM - Understanding the math - convex-functions/ by Brandon Amos 感谢参与翻译同学:@程亚雄 && @张蒙 && @jozee 时间:2018年1月。 出处:http://blog....

2018-01-16 22:42:50

阅读数 7692

评论数 1

原创 机器学习系列(21)_SVM碎碎念part4:无约束最小化问题

原文地址:SVM - Understanding the math - Unconstrained minimization by Alexandre KOWALCZYK 感谢参与翻译同学:@田苗苗 && @樊睿 && @jozee 时间:2018年1月。 ...

2018-01-16 21:39:21

阅读数 7727

评论数 1

原创 深度学习与计算机视觉(12)_tensorflow实现基于深度学习的图像补全

内容识别填充(译注: Content-aware fill ,是 photoshop 的一个功能)是一个强大的工具,设计师和摄影师可以用它来填充图片中不想要的部分或者缺失的部分。在填充图片的缺失或损坏的部分时,图像补全和修复是两种密切相关的技术。有很多方法可以实现内容识别填充,图像补全和修复。在这...

2017-04-17 18:27:09

阅读数 32693

评论数 15

原创 机器学习系列(20)_机器学习性能改善备忘单

机器学习最有价值(实际应用最广)的部分是预测性建模。也就是在历史数据上进行训练,在新数据上做出预测。 而预测性建模的首要问题是: 如何才能得到更好的结果? 这个备忘单基于本人多年的实践,以及我对顶级机器学习专家和大赛优胜者的研究。

2016-12-04 10:46:05

阅读数 16792

评论数 4

原创 机器学习系列(19)_通用机器学习流程与问题解决架构模板

本文由Searchmetrics公司高级数据科学家Abhishek Thakur提供。 “一个中等水平的数据科学家每天都要处理大量的数据。一些人说超过60%到70%的时间都用于数据清理、数据处理及格式转化,以便于在之后应用机器学习模型。这篇文章的重点便在后者—— 应用机器学习模型(包括预处理的阶段...

2016-10-24 11:20:13

阅读数 30468

评论数 8

原创 机器学习系列(18)_Kaggle债务违约预测冠军经验分享

债务违约预测是Kaggle中的一个比赛,本文将介绍取得第一名成绩的方法,本次比赛的目标包括两个方面。其一是建立一个模型,债务人可以通过它来更好地进行财务方面的决策。其二是债权人可以预测这个债务人何时会陷入到财务方面的困境。最终目的是,通过预测未来两年内债务违约的概率,来改进现有的信用评分制度。这是...

2016-10-11 15:54:13

阅读数 40153

评论数 8

原创 机器学习系列(17)_Yelper推荐系统

“推荐”可是个当红话题。Netflix愿意用百万美金召求最佳的电影推荐算法,Facebook也为了登陆时的推荐服务开发了上百个项目,遑论现在市场上各式各样的应用都需要个性化服务。“从互联网中提取信息犹如用消防栓饮水”(Mitchell Kapor)。如今的信息量早已过载,要依据如此嘈杂的信息做出正...

2016-10-10 15:38:24

阅读数 25666

评论数 17

原创 机器学习系列(16)_怎样找到一份深度学习的工作(附学习材料,资源与建议)

如果你是一个软件工程师(或者你现在正在学习这一方面),你肯定有机会听说过深度学习(有时候深度学习缩写为”DL”)。它现在是一个热门、且快速发展的研究领域,解决工业界的一系列问题,从图像识别、手写识别到机器翻译,更甚于AlphaGo4比1击败了世界围棋冠军。 大部分人认为找与深度学习相关的工作应该...

2016-10-10 14:43:06

阅读数 33682

评论数 13

原创 机器学习系列(15)_SVM碎碎念part3:如何找到最优分离超平面

是的,咱们第1篇blog介绍了目标;第2篇blog介绍了向量相关的背景数学知识,看到了如何求解Margin的值;今天这个部分主要目的是和大家一起来看看,选择最优超平面的推理过程。 以下是本篇的一个简短目录: 如何找到最优超平面 如何计算两超平面间的距离 SVM的最优化问题是什么

2016-09-27 18:36:28

阅读数 26389

评论数 5

原创 机器学习系列(14)_SVM碎碎念part2:SVM中的向量与空间距离

第一篇博客part1的部分很短,就说了一个事情,SVM在试图找一个Max Margin(最大间隔)的分离超平面。OK,这个部分要补补基础,复习一下数学,为后面的学习做准备(墙裂建议数学基础好的同学略过此节基础内容...)。咱们来看看SVM涉及到的向量和空间距离。

2016-09-27 11:59:54

阅读数 15179

评论数 4

原创 机器学习系列(13)_SVM碎碎念part1:间隔

欠的总归是要还的,SVM这么神圣的算法是每个学习machine learning的同学可能会头痛却又不得不面对的,即使到现在为止博主这样的Math/CS渣都觉得一定没有领悟到SVM精髓,所以整理了一些边边角角的碎碎念,颤颤巍巍放到这个系列里,算是自己做个总结,也希望能对大家有一点点的帮助。这个SV...

2016-09-27 10:23:23

阅读数 13033

评论数 1

原创 机器学习系列(12)_XGBoost参数调优完全指南(附Python代码)

这篇文章主要讲了如何提升XGBoost模型的表现。首先,我们介绍了相比于GBM,为何XGBoost可以取得这么好的表现。紧接着,我们介绍了每个参数的细节。我们定义了一个可以重复使用的构造模型的函数。 最后,我们讨论了使用XGBoost解决问题的一般方法,在AV Data Hackathon 3.x...

2016-09-25 23:35:50

阅读数 135233

评论数 38

原创 机器学习系列(11)_Python中Gradient Boosting Machine(GBM)调参方法详解

这篇文章详细地介绍了GBM模型。我们首先了解了何为boosting,然后详细介绍了各种参数。 这些参数可以被分为3类:树参数,boosting参数,和其他影响模型的参数。最后我们提到了用GBM解决问题的 一般方法,并且用AV Data Hackathon 3.x problem数据运用了这些方法。

2016-09-25 17:33:34

阅读数 78203

评论数 22

原创 机器学习系列(10)_如何提高深度学习(和机器学习)的性能

我经常被问到诸如`如何从深度学习模型中得到更好的效果`的问题,类似的问题还有:我如何提升准确度,如果我的神经网络模型性能不佳,我能够做什么? 对于这些问题,我经常这样回答,“我并不知道确切的答案,但是我有很多思路”,接着我会列出了我所能想到的所有**或许能够给性能带来提升**的思路,。 为避免...

2016-09-24 23:34:19

阅读数 28844

评论数 2

原创 ML学习分享系列3_计算广告小窥[下]要啥自行车!

提笔写这篇博客,我的内心是惶恐的。原因很简单,作为一个资历尚浅的研究生,是没有资格对计算广告这样一个伟大的行业、领域和学科来评头论足的。之所以这么做,一是总结自己已掌握的知识,二是降低同学们的学习成本。本人能力有限,更缺乏实践经验,文章内容多为书籍和论文的读后感,若有不当或者错误之处,还望各位同学...

2016-08-22 11:26:31

阅读数 23540

评论数 2

原创 深度学习与自然语言处理(8)_斯坦福cs224d RNN,MV-RNN与RNTN

这篇课堂笔记将介绍不同类型的RNN(递归神经网络),并介绍它在NLP领域的应用和优势。 在这篇课笔记中,我们会一起学习一种新的模型,这种模型绝对是以前介绍的那种递归神经网络的加强版!递归神经网络(RNNs)十分适用于有层次的、本身就有递归结构的数据集。

2016-07-30 21:23:06

阅读数 13846

评论数 8

原创 深度学习与自然语言处理(7)_斯坦福cs224d 语言模型,RNN,LSTM与GRU

说明:本文为斯坦福大学CS224d课程的中文版内容笔记,已得到斯坦福大学课程@Richard Socher教授的授权翻译与发表 1.语言模型 语言模型用于对特定序列的一系列词汇的出现概率进行计算。一个长度为m的词汇序列{w1,…,wm}的联合概率被表示为P(w1,…,wm)。由于在得到具体的词...

2016-07-17 15:27:29

阅读数 43191

评论数 3

原创 深度学习与自然语言处理(6)_斯坦福cs224d 一起来学Tensorflow part1

之前的课程里介绍了自然语言处理当中的一些问题,以及设计出来的一些相应的算法。research的东西还是落地到工程应用上比较有价值,之前也手撸过一些toy project,不过这些实现要用在工程中,总是有那么些虚的,毕竟稳定性和效率未必能够保证。所幸的是,深度学习热度持续升温的大环境下,各种大神和各...

2016-07-10 13:12:18

阅读数 27064

评论数 10

原创 深度学习与自然语言处理(5)_斯坦福cs224d 大作业测验2与解答

本文为斯坦福大学CS224d课程的第二次作业内容,原本打算把作业和答案做个编排,一起发出来给大家看,无奈代码量有点大,贴上来以后文章篇幅过长,于是乎题目的代码解答放到了百度云盘,欢迎自行下载和运行或者调整

2016-07-03 16:30:20

阅读数 23147

评论数 0

原创 深度学习与自然语言处理(4)_斯坦福cs224d 大作业测验1与解答

前面一个接一个的Lecture,看得老衲自己也是一脸懵逼,不过你以为你做一个安安静静的美男子(总感觉有勇气做deep learning的女生也是一条汉纸)就能在Stanford这样的学校顺利毕业啦?图样图森破,除掉极高的内容学习梯度,这种顶尖大学的作业和考试一样会让你突(tong)飞(bu)猛(y...

2016-06-26 00:55:33

阅读数 26111

评论数 8

原创 深度学习与自然语言处理(3)_斯坦福cs224d Lecture 3

这是斯坦福CS224d深度学习与自然语言处理的第3课,这节课先会介绍单层和多层神经网络和它们在机器学习分类任务中的应用, 接着介绍如何利用反向传播算法来训练这些神经网络模型(在这个方法中,我们将利用偏导数的链式法则来层层更新神经元参数)。在给出神经网络以及这些算法严谨的数学定义后,介绍了训练神经网...

2016-06-19 09:14:42

阅读数 23937

评论数 7

提示
确定要删除当前文章?
取消 删除