Machine Learning
JK-Ray
拒绝拖延症
展开
-
机器学习的分类与主要算法对比
机器学习的分类与主要算法对比重要引用:Andrew Ng Courera Machine Learning;从机器学习谈起;关于机器学习的讨论;机器学习常见算法分类汇总;LeNet Homepage;pluskid svm 首先让我们瞻仰一下当今机器学习领域的执牛耳者: 这幅图上的三人是当今机器学习界的执牛耳者。中间的是Geoffrey Hinton, 加拿大多伦多大学的教授,如今被聘为“Goo原创 2017-05-31 23:22:21 · 54425 阅读 · 12 评论 -
浅谈GAN生成对抗网络
浅谈GAN——生成对抗网络重要引用:深度学习新星:GAN的基本原理、应用和走向 | 硬创公开课;生成对抗网络(GAN)相比传统训练方法有什么优势?;通过拳击学习生成对抗网络(GAN)的基本原理最近总是听老板提起对抗学习,好奇之心,在网上搜集了一些相关资料,整理如下,大部分摘自重要引用的内容。近年来,基于数据而习得“特征”的深度学习技术受到狂热追捧,而其中GAN模型训练方法更加具有激进意原创 2017-06-01 10:58:29 · 15987 阅读 · 3 评论 -
机器学习的明天——迁移学习
浅谈迁移学习——机器学习的明天 上个月,柯洁大战AlphaGo落下帷幕,19岁的男孩少有地在比赛中落泪,赛后他为我们留下一句话,柯洁说“AlphaGo”看上去像神一样的存在,好像他是无懈可击的··· 的确,DeepMind创造的AlphaGo让人为之赞叹,让柯洁为之疯狂。而背后,从机器学习的角度,充分证明了深度强化学习和大数据的重要意义。DeepMind原创 2017-06-02 23:32:22 · 11174 阅读 · 1 评论 -
David Silver《Reinforcement Learning》课程解读—— Lecture 3: Planning by Dynamic Programming
David Silver《Reinforcement Learning》课程解读—— Lecture 3: Planning by Dynamic ProgrammingDP用来解决MDPs的planning问题,主要解决途径有policy iteration和value iteration。目录:IntroductionPolicy EvaluationPolicy IterationVa原创 2017-06-07 01:25:07 · 1913 阅读 · 0 评论 -
David Silver《Reinforcement Learning》课程解读—— Lecture 4: Model-Free Prediction
David Silver《Reinforcement Learning》课程解读—— Lecture 4: Model-Free PredictionDP动态规划能够解决已知environment的MDP问题,即已知S,A,P,R,γ S,A,P,R,γ,根据是否已知policy又将问题划分为prediction和control的问题。本质上来说这种known MDP问题已知environment即原创 2017-06-22 10:35:12 · 979 阅读 · 2 评论 -
David Silver《Reinforcement Learning》课程解读—— Lecture 5: Model-Free Control
David Silver《Reinforcement Learning》课程解读—— Lecture 5: Model-Free Control上次课谈到了在给定policy的情况下求解未知environment的MDP问题,称之为Model-Free Prediction问题。本节则是解决未知policy情况下未知environment的MDP问题,也就是Model-Free Control问题,原创 2017-09-08 08:54:41 · 1264 阅读 · 1 评论