![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文翻译
文章平均质量分 84
hehedadaq
强化、图像、机器人相关内容...
强化库:https://github.com/kaixindelele/DRLib
求star~
展开
-
关于GPT4权力追求的担忧
GPT4的发布让全球都将目光聚焦到OpenAI上,相比昨天百度的文心一言拉跨的发布会。即便GPT4的技术报告论文,没有公布技术细节,98页的PDF透露出的信息量也足以颠覆三观!GPT-4技术报告翻译by GPT4 and Human Feedback,其中最让我担心的一点就是里面提了一句的power-seeking这个词!这个是中文互联网上极少有讨论的点,我作为一个不愿被AI进化速度淘汰的博士生,想将这个点,尽快的,详细的分享给大家,以引起大家的重视。原创 2023-03-17 14:00:20 · 490 阅读 · 1 评论 -
GPT4论文翻译 by GPT4 and Human
这篇报告内容太多了!!手动复制粘贴和校准折腾了三个小时!求!整体感受如下,gpt4的全域能力,相比gpt3.5尤其是在专业能力上有着全面提升。提供了一些技术思路,但不多。和之前的HFRL相比,又多了一个基于规则的奖励模型,来重新约束模型的有害输出。还有两个需要关注的点就是,视觉输入,正文讲解的不多,大家可以在其他地方仔细查看另外一个是长文本输入,32K的token,结合长文本,一度让我心灰意冷。但这二者的技术细节,目前我翻译的这部分内容,没有细讲。原创 2023-03-15 23:02:23 · 2985 阅读 · 1 评论 -
Optimistic Curiosity Exploration and Conservative Exploitation with Linear Reward Shaping论文总结
(1) 首先,文章提到了均衡探索和利用所面临的探索-利用困境,以及以前研究的各种探索思路,如计数方法、好奇心驱动方法等,但此类方法有着各自的局限性。(4) 实现的具体方法包括:使用改变奖励函数的方法,连续控制任务中称为“保守性利用”,离散控制任务中称为“探究精神”,在实验中证明本文的探究方法比传统方法更有效。(3) 在本文的方法中,研究者使用了离线强化学习、在线连续控制以及单步离线好奇心探索任务,测试了不同深度强化学习任务的结果,并通过实验测试了本文方法的效果。原创 2023-03-07 17:23:28 · 356 阅读 · 0 评论 -
中式英语如何产生?该怎么办?
中式英语如何产生?该怎么办?文章目录中式英语如何产生?该怎么办?前言通过这次课程,希望提高的能力:回归主题:中式英语怎么产生的?问题来了,如果第二门语言直接和真实概念链接起来,效果会好吗?为什么我们小时候没有这样教学?我们该怎么办?前言今天上学术交流英语,因为英语能力一直比较差,用今天老师的自我评估就是:听说读写都不行~所以上课前一直忐忑不安,怕自我介绍,怕被提问,虽然简短的自我介绍应该不成问题。有幸是一位教学经验丰富,拥有二十多年教学科研经验的老师。也算是上过这么多课,遇到的第一位从理论到教学原创 2020-09-22 22:48:04 · 423 阅读 · 0 评论 -
【论文翻译】用于移动机器人导航的Kinect v2:评估和建模
吐槽:哇,为了图像检测的期末报告,我花了两天时间,真是一句一句的翻译过来了。话说中文网站资料是真的靠不住。。。为了Kinect2的使用,我在中文网站上摸索了一个多月,自己摸鱼走了快两个月的弯路,原来很多东西,早就有大佬做过了。。。英语真他么重要~正文——用于移动机器人导航的Kinect v2:评估和建模Kinectv2 for Mobile Robot Navigation:Evaluationa...翻译 2018-06-04 15:18:24 · 2441 阅读 · 0 评论 -
英文不好如何高效快速地阅读英文文献——提供一种快速首篇文献阅读方法
英文不好如何高效快速地阅读英文文献英文不好如何高效快速地阅读英文文献前言关于阅读英文文献的重要性中国人最新最优秀的科研成果基本上都会发表在国外的期刊,用的外文。前言本来是想写一个教程的,后来搜了一下,咦,读研一年多了,我的阅读方式果然不对! 最近感受非常强烈的一个体验就是——没有经过科学系统的训练,你将会走难以预计的弯路! 对于学习生活中经常要做的事儿,最...原创 2018-08-14 15:50:58 · 25929 阅读 · 3 评论 -
Deep Reinforcement Learning: Pong from Pixels翻译和简单理解
Deep Reinforcement Learning: Pong from PixelsMay 31, 2016This is a long overdue blog post on Reinforcement Learning (RL). RL is hot! You may have noticed that computers can now automatically learn ...翻译 2019-02-13 22:43:03 · 3020 阅读 · 7 评论