自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

转载 机器学习实践中应避免的七种常见错误

http://dataunion.org/11624.html 作者:Cheng-Tao Chu‘s  LinkedIn 在机器学习领域,每个给定的建模问题都存在几十种解法,每个模型又有难以简单判定是否合理的不同假设。在这种情况下,大多数从业人员倾向于挑选他们熟悉的建模...

2015-08-06 20:05:58 1137 0

原创 scikit-learn:在实际项目中用到过的知识点(总结)

零、所有项目通用的: http://blog.csdn.net/mmc2015/article/details/46851245(数据集格式和预测器) http://blog.csdn.net/mmc2015/article/details/46852755(加载自己的原始数据) (适合文本...

2015-07-27 08:34:35 6745 4

原创 看过的较好的资源和待看的资源

网上的资源很多,本人只推荐看过的自认为较好的推荐给大家: 机器学习基础: 推荐: Tom Mitchell: http://book.douban.com/subject/1102235/  中英文对照,了解该方向的专业名词,了解大概算法、思想。 http://www.cs.cmu.edu/~...

2015-06-04 10:14:24 1815 0

原创 很认真的中了两篇AAAI2020的文章:NCC-MARL: Neighborhood Cognition Consistent Multi-Agent Reinforcement Learning.

第一篇:NCC-MARL: Neighborhood Cognition Consistent Multi-Agent Reinforcement Learning. NCC-MARL is a general RL framework to handlelarge-scalemulti-age...

2019-11-16 19:30:48 982 2

转载 Leetcode刷题指南

参考:https://blog.csdn.net/qq_39521554/article/details/79160815   二、刷题方法 方法一:按照题目出现频率刷题 顺序参考文章最后的部分 方法二:标签法 按照网站给大家排列的不同tags,起到模块化的复习和学习作用。举个例子:比如...

2019-02-13 19:21:48 5013 0

原创 很认真的中了一篇AAMAS2019的文章:Modelling the Dynamic Joint Policy of Teammates with Attention Multi-agent DDPG

【有中相同会议的小伙伴记得联系我哦,可以一起商量着把会议相关的事情做好】 这篇文章是利用深度强化学习(Deep Reinforcement Learning)做多智能体合作(multi-agent cooperation)。 主要贡献点在于使用了一个attention机制 in a princ...

2019-01-23 15:46:03 1965 1

原创 dropout为什么有用。Dropout在RNN中的应用综述。

  想起来前两天小师弟问我问题,为什么dropout是有用的,看起来像是一个有bug的操作。   这里谈下自己的理解,不一定正确: 1)dropout的经典解读之一是network的ensemble,每次drop不同的weights,从而形成不同的sub-network,最后ensembl...

2018-09-25 20:40:16 2831 0

转载 Cross-Entropy Method (CEM, 交叉熵方法) 与强化学习

转自:https://the0demiurge.blogspot.com/2017/08/cross-entropy-method-cem.html   前言 之前阅读Deep Reinforcement Learning: Pong from Pixels的时候,作者在文中最后提到“One...

2018-08-17 21:25:24 3126 0

转载 TensorFlow中实用的知识:在静态图中写条件判断语句

https://mp.weixin.qq.com/s?__biz=MzU2OTA0NzE2NA==&mid=2247493703&idx=1&sn=7944d78c692d5f7590ba052bbf75a235&chksm=fc86...

2018-07-28 08:31:45 3383 0

原创 CS224N(Natural Language Processing with Deep Learning)总结:模型、任务、作业、作业中涉及到的特殊代码

  模型:word2vec(skip-gram、CBOW)、GloVe、DNN/BP/Tips for training、RNN/GRU/LSTM、Attention、CNN、TreeRNN 应用:Neural Machine Translation、Dependency Parsing、...

2018-07-16 20:58:33 1487 2

原创 PAKDD2018小结

会议整体概况610+投稿量long paper:57,9.63%short paper:107,18.07%【placeholder for pictures】投稿量最多的是applications录稿量最多的是mining graph and network data【placeholder f...

2018-06-14 08:37:17 3117 1

原创 The gossip problem【多智能体通信达成全局一致性需要的最少通信次数】

https://www.sciencedirect.com/science/article/pii/0012365X73901210https://arxiv.org/abs/1511.00867

2018-04-11 13:31:42 511 0

原创 如何解释policy gradient中的baseline具有降低variance的作用

在增强学习中有一大类方法叫policy gradient,最典型的是REINFORCE。在这类方法中,目标函数J(w)(通常是the expectation of long term reward)对policy参数w的gradient为:▽J(w) == E[ ▽logπ(a|s) * retu...

2018-04-09 23:24:22 2012 0

原创 如果环境存在random,那么问题还能建模成MDP吗?

李宏毅老师的课程:https://www.youtube.com/watch?v=W8XF3ME8G2I老师说,对于同一个observation/state(atari game的画面),也不一定会采取相同的动作,因为有些actor是stochastic的,选action有一定随机性,这一点好理解...

2018-03-16 08:16:32 360 0

原创 梯度截断的tensorflow实现

gradients = optimizer.compute_gradients(loss, var_list) capped_gradients = [(tf.clip_by_value(grad, -5., 5.), var) for grad, var in gradients if grad...

2018-03-02 09:18:09 3070 2

原创 水了一篇PAKDD2018的文章:Topic-specific Retweet Count Ranking for Weibo

看题目就知道做什么工作:Topic-specific Retweet Count Ranking for Weibo摘要:In this paper, we study \emph{topic-specific} retweet count ranking problem in Weibo. Tw...

2018-02-24 08:26:36 2733 7

原创 使用CNN kernel对图像进行【锐化、模糊、浮雕等】处理

发现一门将tensorflow的不错的课程。 https://web.stanford.edu/class/cs20si/2017/lectures/slides_07.pdf 之前做过一个相机的APP,当时做图片美化,些非常多的代码效果不一定好。 下面这个图提醒我们,其实直接使用CNN...

2018-01-22 16:47:25 1526 1

原创 python3练习

参考:http://www.runoob.com/python3/python3-tutorial.html 输入: >>> a=input("input something:") input something:hello world >...

2018-01-15 21:25:46 599 0

转载 2017年AI关键技术盘点:AlphaGo/GAN/Capsule/基于DL的CTR预估/CV/NLP

写的挺好,转一下。 2017年AI技术盘点:关键进展与趋势 原创 2018-01-04 张俊林 人工智能头条 作者 | 张俊林 责编 | 何永灿 人工智能最近三年发展如火如荼,学术界、工业界、投资界各方一起发力,硬件、算法与数据共同发展,不仅仅...

2018-01-05 09:52:31 1179 0

原创 通过【端口转发】在服务器上使用TensorBoard

如果是一次转发:https://stackoverflow.com/questions/37987839/how-can-i-run-tensorboard-on-a-remote-serverdown voteHere is what I do to avoid the issues of ma...

2017-11-26 20:56:43 3700 2

原创 MARL(multi-agent reinforcement learning)的一些边缘文章(imitation、transfer、security等)

参考:https://github.com/LantaoYu/MARL-Papers 7.4.2、Inverse MARL [1] Cooperative inverse reinforcement learning by Hadfield-Menell D,Russell S J, ...

2017-11-07 20:40:22 4298 0

转载 SELU激活函数,scaled exponential linear units

SELU、ReLU、leaky ReLU对比: https://github.com/shaohua0116/Activation-Visualization-Histogram 关于SELU激活函数的详细介绍,从这个地址转来的: http://blog.csdn.net...

2017-09-25 17:04:54 5617 0

转载 Jacobian矩阵和Hessian矩阵

关于Jacobian矩阵和Hessian矩阵的介绍,挺简单明了的: http://jacoxu.com/jacobian%E7%9F%A9%E9%98%B5%E5%92%8Chessian%E7%9F%A9%E9%98%B5/ 需要注意一点, 楼主你好,我和楼上一样不太懂你写的牛顿法求最优化那...

2017-09-25 14:46:37 452 0

转载 Image Completion with Deep Learning in TensorFlow【DCGAN,图像补全】

写的不错,直接拿来了。 http://bamos.github.io/2016/08/09/deep-completion/#so-how-can-we-complete-images IntroductionStep 1: Interpreting images ...

2017-09-13 09:36:45 2740 1

原创 多用户linux下安装tensorflow、keras环境;如何在系统自带python和Anaconda间切换

每次装的时候都要犯过去犯过的错误,记录一下,下次直接照着来: 1)安装anaconda 直接bash Anaconda2-4.4.0-Linux-x86_64.sh(一路enter、yes、ok之类的) 可以考虑source ~/.bashrc 注意,这里可以which p...

2017-09-09 17:02:42 1751 0

转载 变形卷积核、可分离卷积?卷积神经网络中十大拍案叫绝的操作。

总结的非常好,故转来,如果侵权,请告知,会及时删掉。 大家还是去看原文好,作者的文章都不错: https://zhuanlan.zhihu.com/p/28749411 https://www.zhihu.com/people/professor-ho/posts 写文章 ...

2017-08-31 14:08:49 17401 1

转载 从语言学到深度学习NLP,【一文概述自然语言处理】

两篇文章确实不错。 https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650729976&idx=1&sn=1f2e64ae2baefd82fd6dcac86d2cc77e&chksm=871b2...

2017-08-21 22:52:59 2919 0

转载 【避免AI错把黑人识别为大猩猩】伯克利大学提出协同反向强化学习【论rewards设计的重要性】

因为之后打算写一篇rewards设计的文章,所以看到这个文章觉得是个有力的出发点。 另外,文章本身也很不错。 https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652002837&idx=5&sn=c9...

2017-08-21 20:20:21 987 0

转载 无需数学背景,读懂ResNet、Inception和Xception三大变革性架构

写的确实不错: resnet:加深、通过identity mapping实现 inception:加宽、让网络自动选择5*5卷积、3*3卷积还是max-pooling那个更好,通过1*1卷积实现运算量的减少 Xception:将通道间的关系和空间上的关系分开进行识别 https:/...

2017-08-21 20:15:19 1776 0

原创 《reinforcement learning:an introduction》第十三章《Policy Gradient Methods》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 13.1 Policy A...

2017-08-15 09:57:11 984 0

原创 《reinforcement learning:an introduction》第十一章《Off-policy Methods with Approximation》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 ...

2017-08-08 19:14:51 430 0

原创 《reinforcement learning:an introduction》第十章《On-policy Control with Approximation》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 ...

2017-08-08 18:53:23 703 0

原创 《reinforcement learning:an introduction》第九章《On-policy Prediction with Approximation》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 9.1 Va...

2017-08-07 14:33:56 1013 0

原创 《reinforcement learning:an introduction》第八章《Planning and Learning with Tabular Methods》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 8.1 Mod...

2017-08-03 11:03:27 1308 0

原创 《reinforcement learning:an introduction》第七章《Multi-step Bootstrapping》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 7.1 n-ste...

2017-08-02 19:30:26 1514 4

转载 Deep Learning for NLP Best Practices

写的挺好,选择的话题都是很经典的。 原文:http://ruder.io/deep-learning-nlp-best-practices/index.html#introduction 译文:http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw...

2017-07-28 08:27:37 1306 0

原创 《reinforcement learning:an introduction》第六章《Temporal-Difference Learning》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 注意:本章考虑...

2017-07-25 20:41:12 1325 2

原创 《reinforcement learning:an introduction》第五章《Monte Carlo Methods》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 注意:本章考虑mo...

2017-07-25 19:36:19 1878 0

转载 【致敬ImageNet】ResNet 6大变体:何恺明,孙剑,颜水成引领计算机视觉这两年

文章写得挺好,故转载来。 http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652001197&idx=1&sn=4239318655806de8ed807d44cdb1b99c&chksm=f121275...

2017-07-23 07:45:26 5713 2

原创 《reinforcement learning:an introduction》第四章《Dynamic Programming》总结

由于组里新同学进来,需要带着他入门RL,选择从silver的课程开始。 对于我自己,增加一个仔细阅读《reinforcement learning:an introduction》的要求。 因为之前读的不太认真,这一次希望可以认真一点,将对应的知识点也做一个简单总结。 Lecture 3...

2017-07-18 09:53:47 1167 0

提示
确定要删除当前文章?
取消 删除