总结
JasonSparrow_1
这个作者很懒,什么都没留下…
展开
-
Reinforcement Learning易忘知识点总结
value function 常用的公式: 表示可以对未来的期望打出一定的折扣,着重考虑一些固定的reward。 当γ\gammaγ的值为0时为只考虑立即不考虑长期;当值为1时立即和长期考虑同等重要。 状态值函数(state value function)和动作值函数(action value function Q函数)是不同的 ...原创 2019-03-29 15:29:12 · 541 阅读 · 0 评论 -
Learning Latent Dynamics for Planning from Pixels
Abstract The Deep Planning Network (PlaNet), a purely model-based agent that learns the environment dynamics from images and chooses actions through fast online planning in latent space. PlaNet一个纯的mo...原创 2019-06-25 11:32:03 · 681 阅读 · 1 评论 -
A fuzzy physiological approach for continuously modeling emotion during interaction with play game
Introduction 传统的针对productivity environments(task表现)的度量手段不能很好的适应目前的affective environments,因为我们现在考虑的不是performance,而是通过现在的游戏环境,能够带给我们什么样的情绪。 Affective evaluation of entertainment technologies 传统的评估情绪的方法...原创 2019-07-02 17:02:01 · 736 阅读 · 0 评论 -
Personalized Estimation of Engagement from Videos Using Deep Reinforcement Learning
Introduction 能够准确的识别用户的参与状态能很好的使一些系统能够在恰当的时间提供必要的交互来完成交互的任务。 参与评估的一个基本挑战是人们如何激发参与以及如何在计算参与模型中表示参与。 传统的方法使用非语言的参与线索,如注视模式、身体姿势、韵律、面部表情、空间关系和任务上下文行为。 因为个体与个体之间的差异性较大,所以造成训练集训练出来的模型利用测试集进行测试的结果效果很差。 然而,...原创 2019-07-19 14:57:39 · 237 阅读 · 0 评论