ML
文章平均质量分 82
Light_blue_love
这个作者很懒,什么都没留下…
展开
-
CS229 Lecture 20
CS229 Lecture 20POMDPs(Partially Observed MDPs)Policy searchReinforcePagasusconclusion回顾st+1=Ast+Bat+wts_{t+1}=As_t+Ba_t+w_tst+1=Ast+Bat+wtyt=Cst+vty_t=Cs_t+v_tyt=Cst+vtAt+1:at+1=LtstA_{t+1}:a_{t+1}=L_ts_tAt+1:at+1=Ltst在LQR问题中,因为噪声原创 2021-05-15 21:33:24 · 186 阅读 · 0 评论 -
CS229 Lecture 19
CS229 Lecture 19Debugging RL algorithmDifferential Dynamic Programming (DDP)Kalman FilterLinear Quadratic Gaussian (LQG)原创 2021-05-09 19:10:32 · 247 阅读 · 0 评论 -
CS229 Lecture 18
CS229 Lecture 18state-action rewardFinite-horizon MDPsLinear dynamic SystemLinear Quadratic Regulation(LQR)Discrete Ricatti equations回顾马尔可夫决策过程定义为:MDP(S,A,{Psa},γ,R)MDP(S,A,\{P_{sa}\},\gamma,R)MDP(S,A,{Psa},γ,R),其中: &nbs原创 2021-05-02 20:31:39 · 286 阅读 · 0 评论 -
CS229 Lecture 17
CS229 Lecture 17Continuous state MDPs1. Discretization2. Value function approximation原创 2021-04-24 15:15:52 · 189 阅读 · 0 评论 -
CS229 Lecture 16
CS229 Lecture 16强化学习马尔可夫决策过程(MDPs)value functionvalue iterationpolicy iterationMarkov Decision ProcessMDP(S,A,,γ,R)MDP(S,A,,\gamma,R)MDP(S,A,,γ,R)SSS对应状态集合AAA对应动作集合PsaP_{sa}Psa是一个状态转换分布∑Psa(c)=1,Psa(s)≥0\sum P_{sa}(c)=1,P_{sa}(s)\geq0∑Psa(c原创 2021-04-05 13:34:34 · 141 阅读 · 0 评论 -
CS229 Lecture 15
CS229 Lecture 15Singular Value Decomposition(SVD)Independent Component Analysis(ICA)原创 2020-08-16 12:43:36 · 254 阅读 · 0 评论 -
CS229 Lecture 14
CS229 Lecture 14课程要点:Factor Analysis - EM stepPrincipal Components Analysis (PCA)原创 2020-08-02 18:03:57 · 200 阅读 · 0 评论 -
CS229 Lecture 13
CS229 Lecture 13课程要点:Mixture of GaussiansNative of BayesFactor AnalysisGaussians Distribution原创 2020-07-12 18:07:59 · 318 阅读 · 0 评论 -
CS229 Lecture 12
CS229 Lecture 12课程要点:无监督学习聚类(K-Means)Mixtures of GaussiansJensen’s InequalityEM(Expectation Maximization)Loading!原创 2020-06-27 23:20:43 · 364 阅读 · 0 评论 -
CS229 Lecture 11
CS229 Lecture 11课程要点:Bayesian statistics and regularizationOnline LearningActive for apply ML Algorithm贝叶斯统计和正则化上节课讲了如何通过特征选择减少特征数目,进而降低算法出现过拟合的风险,本节会介绍另一种降低过拟合的方法,即正则化,这种方法不会减少特征的数目。前面讲述过线性回归其通过最大似然的方式求解θ\thetaθmaxθ ∏i=1mp(y(i)∣x(i);θ)\matho原创 2020-06-20 22:48:18 · 247 阅读 · 0 评论 -
CS229 Lecture 1
CS229 Lecture 1监督学习学习理论无监督学习强化学习监督学习:学习算法是有标准答案的,即训练数据是有对应的标签的。如线性回归,分类算法都属于监督学习。无监督学习:即学习算法对于学习的结果是否正确是没有标准答案,这类学习主要是通过对数据特征的学习,发现数据中潜在的规律。例如聚类算法。强化学习:该学习是一个不断强化的过程,并不是一次性的。这类学习算法做出相应的动作,系统是...原创 2019-07-13 10:56:42 · 308 阅读 · 0 评论 -
在Eclipse中如何利用在Anaconda中建立的Python虚拟环境进行开发
由于学习用到tensorFlow,而电脑上的python版本为3.6,在当时tensorFlow还只支持python3.5并不支持3.6,(这就很尴尬了)。所以用anaconda创建了一个python3.5版本的虚拟环境(我将其命名为"tensflow")。当时创建好后不知道怎么让Eclipse利用anaconda建立的虚拟环境进行开发。相信刚刚接触anaconda进行开发的人也一样不知所错。下面原创 2017-10-27 15:21:01 · 2440 阅读 · 0 评论 -
机器学习基石作业一PLA算法
本文实现机器学习基石课程作业一种关于PLA算法的实现,算法由python实现。 机器学习基石作业一中15-17题,pla算法是有错才更新,直到算法在看到的数据上全部正确它就会停下来(当然前提是数据线性可分才行)。 第15题的题干如下: 16题如下: 17题如下: 从上面的描述可以看出,15题仅仅需要执行一原创 2017-07-30 16:16:02 · 1736 阅读 · 0 评论 -
windows上基于anaconda安装tensorflow
众所周知tensorflow是一款由谷歌开发的深度学习框架,本文就来谈谈在windows操作系统上怎样安装tensorflow。由于我的电脑上安装的是python3.6,而基于windows安装的tensorflow到目前谷歌只支持python3.5。因此我通过anaconda建立了基于python3.5的tensorflow的运行环境。在window下的命令行窗口中输入:(下原创 2017-06-01 15:58:08 · 1644 阅读 · 1 评论 -
近邻分类器
最近邻分类器(Nearest Neighbor Classifier) 用图片分类举个例子(最然这种算法对图片分类的效果并不好):给定一个图片数据集,其分为训练集和测试集。最近邻算法其实并没有一般机器学习算法的流程如初始化参数,训练拟合等等。最近邻算法的实质便是将测试集中的图片数据与训练集中的图片数据逐一进行比较。寻找到跟这个测试数据最相近的训练数据所对应的标签,这个原创 2017-04-18 21:13:32 · 2182 阅读 · 0 评论