无所知的博客

技术和白日梦

机器学习技法 Lecture8: Adaptive Boosting

机器学习技法 Lecture8: Adaptive BoostingMotivation of BoostingDiversity by Re-weightingAdaptive Boosting AlgorithmAdaptive Boosting in Action Motivation of...

2018-12-14 17:13:03

阅读数:3

评论数:0

机器学习技法 Lecture7: Blending and Bagging

机器学习技法 Lecture7: Blending and BaggingMotivation of AggregationUniform BlendingLinear and Any BlendingBagging(Bootstrap Aggregation) Motivation of Agg...

2018-12-11 16:09:49

阅读数:8

评论数:0

机器学习技法 作业一

机器学习技法 作业一 1 线性软间隔原始问题,有松弛变量。一共N+d+1个变量。 2 变化之后发现分割线为z1=4.5z_{1}=4.5z1​=4.5。 3 用ovxopt手撸一个svm,把系数对应上即可。ovxopt的接口系数与ppt上qp问题系数有正负号的变化,需要注意。起始也可以直接用s...

2018-12-10 23:03:41

阅读数:9

评论数:0

深度强化学习cs294 Lecture8: Deep RL with Q-Function

深度强化学习cs294 Lecture8: Deep RL with Q-Function1. How we can make Q-learning work with deep networks2. A generalized view of Q-learning algorithms3. Tr...

2018-12-06 14:50:42

阅读数:29

评论数:0

深度强化学习cs294 Lecture7: Value Function Methods

深度强化学习cs294 Lecture7: Value Function MethodsValue-based MethodsQ-LearningValue Function Learning Theory 回忆上节课所讲的内容,关于actor-critic算法的讲解。将policy gradie...

2018-12-05 20:08:24

阅读数:17

评论数:0

机器学习技法 Lecture6: Support Vector Regression

机器学习技法 Lecture6: Support Vector Regression1. Kernel Ridge Regression2. Support Vector Regression Primal3. Support Vector Regression Dual4. Summary of...

2018-12-04 15:41:08

阅读数:7

评论数:0

机器学习技法 Lecture5: Kernel Logistic Regression

机器学习技法 Lecture5: Kernel Logistic Regression1. Soft-Margin SVM as Regularized Model2. SVM versus Logistic Regression3. SVM for Soft Binary Classificat...

2018-12-03 20:59:38

阅读数:4

评论数:0

深度强化学习cs294 Lecture6: Actor-Critic Algorithms

深度强化学习cs294 Lecture6: Actor-Critic Algorithms1. Improving the policy gradient with a critic2. The policy evaluation problem3. Discount factors4. The ...

2018-11-28 16:11:24

阅读数:29

评论数:0

深度强化学习cs294 Lecture5: Policy Gradients Introduction

深度强化学习cs294 Lecture5: Policy Gradients Introduction1. The policy gradient algorithm2. What does the policy gradient do?3. Basic variance reduction: c...

2018-11-27 20:36:38

阅读数:24

评论数:0

机器学习技法 Lecture4: Soft-Margin Support Vector Machine

机器学习技法 Lecture4: Soft-Margin Support Vector MachineMotivation and Primal ProblemDual ProblemMessages behind Soft-Margin SVMModel Selection Motivation...

2018-11-27 11:06:09

阅读数:20

评论数:0

ubuntu16.04 重装系统后要做的事情总结

ubuntu16.04 重装系统后要做的事情总结前言要做的与对应链接 前言 今天ubuntu崩掉了,进入登录界面的时候鼠标键盘都没有反应。搜了好久没有解决于是重装。 还好我当初安装的时候把根目录/和/home目录挂载在了两个分区,所以/home的数据重装以后还能够保留。如果是第一次安装可以直接参考...

2018-11-26 19:18:57

阅读数:37

评论数:0

深度强化学习cs294 HW1: Imitation Learning

终于把第一次作业完成了,不过实现效果貌似很差,调不好了就这样吧。 Section 1 第一部分先装环境。没啥好说的。我用的anaconda直接pip install 对应的作业1文件夹里的requirement.txt。其中MuJoCo需要激活个key,可以去官网使用学生邮箱申请一个免费的,时间为...

2018-11-25 19:54:43

阅读数:33

评论数:0

机器学习技法 Lecture3: Kernel Support Vector Machine

Kernel Trick 回顾一下SVM的对偶形式。使用对偶形式的目的是为了拜托映射到新的空间之后假设空间VC维d^\widehat{d}d对于算法的影响。但是进行了对偶之后发现,解对偶的SVM的时候也有跟d^\widehat{d}d有关的计算。 如果使用的是简单的二次项映射,那么计算映射之后的...

2018-11-23 17:09:44

阅读数:31

评论数:0

深度强化学习cs294 Lecture3&Lecture4: Introduction to Reinforcement Learning

深度强化学习cs294 Lecture3&Lecture4: Introduction toReinforcement Learning1. Definition of a Markov decision process2. Definition of reinfo...

2018-11-23 15:58:28

阅读数:52

评论数:0

深度强化学习cs294 Lecture2: Supervised Learning of behaviors

cs294 Lecture2: Supervised Learning of behaviorsDefinition of sequential decision problemsTerminology & notationImitation learning: s...

2018-11-22 21:31:27

阅读数:25

评论数:0

深度强化学习cs294 Lecture1: Introduction and Course Overview

cs294 Lecture1: Introduction and Course Overview强化学习介绍为什么现在学习深度强化学习序列决策需要解决的其他问题reward从哪里来其他类型的监督学习我们如何建立智能系统 第一次看到了该做hw1,然后被吓退。而今卷土重来,一定好好上完23333 ...

2018-11-21 23:24:23

阅读数:29

评论数:0

机器学习技法 Lecture2: Dual Support Vector Machine

机器学习技法 Lecture2: Dual Support Vector MachineMotivation of Dual SVMLagrange Dual SVMSolving Dual SVMMessages behind Dual SVM Motivation of Dual SVM 首先...

2018-11-21 15:40:42

阅读数:12

评论数:0

机器学习技法 Lecture1: Linear Support Vector Machine

机器学习技法 Lecture1: Linear Support Vector MachineLarge-Margin Separating HyperplaneStandard Large-Margin ProblemSupport Vector MachineReasons behind Lar...

2018-11-19 15:21:08

阅读数:19

评论数:0

机器学习基石 作业四

机器学习基石 作业四 1 假设函数空间变小了,固定噪声大体上会变大。因为假设函数与真实函数之间的差距可能变大了。 2 从第三项就等于0的假设函数包含于从第四项系数才等于0的。 3 直接求导 4 因为加正则项相当于对系数加了个限制。如果最优点在那个限制的球内则相等,否则肯定小于不加限制的时候。...

2018-11-15 22:20:12

阅读数:14

评论数:0

机器学习基石 Lecture16: Three Learning Foundations

机器学习基石 Lecture16: Three Learning FoundationsOccam's RazorSampling BiasData SnoopingPower of Three Occam’s Razor 奥卡姆剃刀原则:如无必要勿增实体。 对这个原则的理解相当于是说,在机器学...

2018-11-15 10:37:49

阅读数:28

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭