LucianMa-CSDN博客

原创【纠错-已解决】RuntimeError: result type Float can’t be cast to the desired output type long int

此时我们发现不报错，可以正常执行，那么显而易见，是做in-place操作时出现了错误，而不是运算过程出现问题，因为此时的in-place操作不涉及类型转换但涉及计算！结果喜人，并没有出现报错，但其数据类型依然没有出现我们期待的‘向上兼容’，即float32的tensor并没有因为in-place操作而转换为float64型。那么我们进一步思考，是只有long->float转换时出现问题吗？我们让float64对float32进行in-place操作，看是否会出现报错，若不会，一同检查其数据类型。

2024-11-15 18:01:33 1236

原创【强化学习简明】台大李宏毅强化学习2021版课程笔记

An Example 一个例子我们用一个例子来介绍什么是强化学习下围棋时，AlphaGo观察棋盘作为模型的输入，将落子作为输出，在多数情况下，它得不到任何奖励。如果AlphaGo获胜，它得到奖励：1如果AlphaGo失败，它受到惩罚：-1AlphaGo根据得到的奖励或惩罚来判断自己做的好或者做的不好，再做出相应的调整这就是强化学习。

2024-10-24 21:56:04 1932