机器学习
文章平均质量分 74
qq907177955
这个作者很懒,什么都没留下…
展开
-
Deep Q Learning
转载自:https://www.jianshu.com/p/e6f5e9589285概述DQN其实是深度学习和强化学习知识的结合,也就是用Deep Networks框架来近似逼近强化学习中的Q value。其中,使用的Deep Networks有两种框架,分别如下图所示:框架1框架1的输入是State和Action,State可以是一个游戏画面,Action可以是向下走,开火等,通过Network输出的是在State的情况下采取Action的Q value。框架2框架2的输入是当前的Stat转载 2020-05-14 00:04:29 · 259 阅读 · 0 评论 -
Q-Learning 算法学习心得
1 Q-learning算法是智能体(agent)通过与环境进行不停的交互,并从环境中得到行为反馈,最终生成一个状态-行为的奖励表(Q table)。而我们的智能体(agent),根据这个q table来进行决策,完成人类交给她的各种任务的。例如:一个agent为O,在一个二维的直线上,从左边移动到右边的目标点T处,即完成任务。O_________________T 对于以上的例子,O有从起始点到终点T这条线段长度状态(Status s),并且每个状态有左(left)、右(right)两种行原创 2020-05-13 22:55:00 · 1548 阅读 · 1 评论 -
coursera课程 machine learning 笔记 (一)
课程讲师:Andrew Ng 吴恩达(斯坦福教授,百度首席科学家) 课程地址:https://www.coursera.org/learn/machine-learning/lecture/1VkCb/supervised-learning(注:括号里基本上是我自己的理解,如有错误请指出,勿喷,少男身少女心,谢谢。)首先对简单说说我对人工智能的认识:本质是学习然后预测,人工智能总的来说就...原创 2018-06-07 23:42:06 · 887 阅读 · 0 评论 -
信息熵与Gini不纯度
1、信息熵 信息论中的信息量和信息熵。 信息量: 信息量是对信息的度量,就跟温度的度量是摄氏度一样,信息的大小跟随机事件的概率有关。 例如: 在哈尔滨的冬天,一条消息说:哈尔滨明天温度30摄氏度,这个事件肯定会引起轰动,因为它发生的概率很小(信息量大)。日过是夏天,“明天温度30摄氏度”可能没有人觉得是一个新闻,因为夏天温度30摄氏度太正常了,概率太大了(信息点太小了)从这个例子中可以...转载 2018-07-31 20:20:53 · 797 阅读 · 0 评论 -
Python Scikit-Learn ML
# url:https://elitedatascience.com/python-machine-learning-tutorial-scikit-learn# or url: https://34tzkp3af7ck1k675g1stf6n-wpengine.netdna-ssl.com/wp-content/uploads/2018/05/Python-Machine-Learning-C...原创 2018-08-05 18:28:41 · 133 阅读 · 0 评论 -
Imbalanced Classes(处理不平衡特征)
Disease Screening Exampleurl:https://elitedatascience.com/imbalanced-classes url:阿里云译文First, please note that we’re not going to split out a separate test set, tune hyperparameters, or implement ...原创 2018-08-05 18:33:29 · 968 阅读 · 0 评论