DeepRacer线下比赛总结 2022 地图 Re Invent 2018

最新推荐文章于 2023-06-17 12:39:27 发布

AI架构师易筋

最新推荐文章于 2023-06-17 12:39:27 发布

阅读量2k

点赞数 1

分类专栏：机器学习杂文文章标签： 1024程序员节 Deep Racer

本文链接：https://blog.csdn.net/zgpeace/article/details/127484116

版权

机器学习杂文专栏收录该内容

34 篇文章

订阅专栏

先看笔者团队线下的DeepRacer Model测试动图gif。
请添加图片描述

1. 线下比赛策略：

激进：waypoint 还是有点激进，感觉跟速度没多大关系。
稳妥：不用waypoint，中线。默认的中线算法，1m/s~2.8m/s, 模拟器可以抛出10m/s 的速度。
参考 https://www.linkedin.com/pulse/aws-deepracer-my-journey-from-17-seconds-95-dante-chen?trk=pulse-article_more-articles_related-content-card

注意点
在这里插入图片描述

https://aws.amazon.com/cn/blogs/china/practical-application-analysis-of-amazon-deepracer-multiple-strategy-models/
训练的模型过拟合了，因为我们选取的是一个已经训练了 12h 的模型，在完整跑完测试赛道之后还进行了很多轮训练。过拟合很可能是大多数队伍最终线下效果不及预期的一个最重要原因，后面我们还将花一些篇幅介绍我们对过拟合问题的理解。

2. 中线算法2个小时model，跑进10s一圈

Model 在模拟器上要求完成率要超过95%以上，才有可能完成物理赛道。
在这里插入图片描述

Reward function

def reward_function(params):
    '''
    Example of rewarding the agent to follow center line
    '''
    
    # Read input parameters
    track_width = params['track_width']
    distance_from_center = params['distance_from_center']
    
    # Calculate 3 markers that are at varying distances away from the center line
    marker_1 = 0.1 * track_width
    marker_2 = 0.25 * track_width
    marker_3 = 0.5 * track_width
    
    # Give higher reward if the car is closer to center line and vice versa
    if distance_from_center <= marker_1:
        reward = 1.0
    elif distance_from_center <= marker_2:
        reward = 0.5
    elif distance_from_center <= marker_3:
        reward = 0.1
    else:
        reward = 1e-3  # likely crashed/ close to off track
    
    return float(reward)