MikasaQ-CSDN博客

原创大模型无关真理，实践才是

大模型无关真理，实践才是前言符号智能计算智能机器学习总结前言假设此时此刻面对一个无法输出的检索问题或者一个效果较差的神经网络模型，大多数情况下我的本能反应告诉我，接下来要增加检索的时间和次数、添加多一些的网络层数和参数等等。这并不是逃避问题的表现，反而贪婪策略在约束较少的情况下往往是收敛较快的策略，也往往是被试的第一种策略。事实上，让模型变得更大更复杂自人工智能在达特茅斯诞生之初就始终伴随着它的成长。符号智能紧跟着人工智能概念一起诞生的符号智能催生了最早起的智能实践：专家系统，它运用知识和推理

2022-04-19 01:12:45 2663

AWR算法部分.pptx

关于2019年的论文Advantage-weighted regression Simple and scalable off-policy reinforcement learning的算法部分的理解梳理与解释。

2020-12-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 大模型无关真理，实践才是

AWR算法部分.pptx

空空如也

原创大模型无关真理，实践才是