2024年网安最新AI实战，用Python玩个自动驾驶！

最新推荐文章于 2024-07-18 16:25:07 发布

2401_84297899

最新推荐文章于 2024-07-18 16:25:07 发布

阅读量496

点赞数 20

分类专栏：程序员文章标签：人工智能 python 自动驾驶

本文链接：https://blog.csdn.net/2401_84297899/article/details/138373926

版权

程序员专栏收录该内容

160 篇文章 0 订阅

订阅专栏


安装自动驾驶模块，这里使用 Edouard Leurent 发布在 github 上的包 highway-env：

pip install --user git+https://github.com/eleurent/highway-env


其中包含6个场景：


* 高速公路——“highway-v0”
* 汇入——“merge-v0”
* 环岛——“roundabout-v0”
* 泊车——“parking-v0”
* 十字路口——“intersection-v0”
* 赛车道——“racetrack-v0”


详细文档可以参考这里：


https://highway-env.readthedocs.io/en/latest/


### **配置环境**


安装好后即可在代码中进行实验（以高速公路场景为例）：

import gym
import highway_env
%matplotlib inline

env = gym.make(‘highway-v0’)
env.reset()
for _ in range(3):
    action = env.action_type.actions_indexes[“IDLE”]
    obs, reward, done, info = env.step(action)
    env.render()


运行后会在模拟器中生成如下场景：



![图片](https://img-blog.csdnimg.cn/img_convert/bbee95b0aae06428b29c196a7f2d8328.png)


env类有很多参数可以配置，具体可以参考原文档。


### **训练模型**


**1、数据处理**


(1)state


highway-env包中没有定义传感器，车辆所有的state (observations) 都从底层代码读取，节省了许多前期的工作量。根据文档介绍，state (ovservations) 有三种输出方式：Kinematics，Grayscale Image和Occupancy grid。


Kinematics


输出V\*F的矩阵，V代表需要观测的车辆数量（包括ego vehicle本身），F代表需要统计的特征数量。例：


数据生成时会默认归一化，取值范围：[100, 100, 20, 20]，也可以设置ego vehicle以外的车辆属性是地图的绝对坐标还是对ego vehicle的相对坐标。


在定义环境时需要对特征的参数进行设定：

config =
    {
    “observation”:
         {
        “type”: “Kinematics”,
        #选取5辆车进行观察（包括ego vehicle）
        “vehicles_count”: 5,
        #共7个特征
        “features”: [“presence”, “x”, “y”, “vx”, “vy”, “cos_h”, “sin_h”],
        “features_range”:
            {
            “x”: [-100, 100],
            “y”: [-100, 100],
            “vx”: [-20, 20],
            “vy”: [-20, 20]
            },
        “absolute”: False,
        “order”: “sorted”
        },
    “simulation_frequency”: 8,  # [Hz]
    “policy_frequency”: 2,  # [Hz]
    }


Grayscale Image


生成一张W\*H的灰度图像，W代表图像宽度，H代表图像高度


Occupancy grid


生成一个WHF的三维矩阵，用W\*H的表格表示ego vehicle周围的车辆情况，每个格子包含F个特征。


(2) action


highway-env包中的action分为连续和离散两种。连续型action可以直接定义throttle和steering angle的值，离散型包含5个meta actions：

ACTIONS_ALL = {
        0: ‘LANE_LEFT’,
        1: ‘IDLE’,
        2: ‘LANE_RIGHT’,
        3: ‘FASTER’,
        4: ‘SLOWER’
    }


(3) reward


highway-env包中除了泊车场景外都采用同一个reward function：



![图片](https://img-blog.csdnimg.cn/img_convert/2d645b9e89e1d81357c77c576fb67440.png)


这个function只能在其源码中更改，在外层只能调整权重。


（泊车场景的reward function原文档里有）


**2、搭建模型**


DQN网络，我采用第一种state表示方式——Kinematics进行示范。由于state数据量较小（5辆车\*7个特征），可以不考虑使用CNN，直接把二维数据的size[5,7]转成[1,35]即可，模型的输入就是35，输出是离散action数量，共5个。

import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.nn.functional as F
import torch.optim as optim
import torchvision.transforms as T
from torch import FloatTensor, LongTensor, ByteTensor
from collections import namedtuple
import random
Tensor = FloatTensor

EPSILON = 0    # epsilon used for epsilon greedy approach
GAMMA = 0.9
TARGET_NETWORK_REPLACE_FREQ = 40       # How frequently target netowrk updates
MEMORY_CAPACITY = 100
BATCH_SIZE = 80
LR = 0.01         # learning rate

class DQNNet(nn.Module):
    def init(self):
        super(DQNNet,self).init()
        self.linear1 = nn.Linear(35,35)
        self.linear2 = nn.Linear(35,5)
    def forward(self,s):
        s=torch.FloatTensor(s)
        s = s.view(s.size(0),1,35)
        s = self.linear1(s)
        s = self.linear2(s)
        return s

class DQN(object):
    def init(self):
        self.net,self.target_net = DQNNet(),DQNNet()
        self.learn_step_counter = 0
        self.memory = []
        self.position = 0
        self.capacity = MEMORY_CAPACITY
        self.optimizer = torch.optim.Adam(self.net.parameters(), lr=LR)
        self.loss_func = nn.MSELoss()

def choose_action(self,s,e):
        x=np.expand_dims(s, axis=0)
        if np.random.uniform() < 1-e:
            actions_value = self.net.forward(x)
            action = torch.max(actions_value,-1)[1].data.numpy()
            action = action.max()
        else:
            action = np.random.randint(0, 5)
        return action

def push_memory(self, s, a, r, s_):
        if len(self.memory) < self.capacity:
            self.memory.append(None)
        self.memory[self.position] = Transition(torch.unsqueeze(torch.FloatTensor(s), 0),torch.unsqueeze(torch.FloatTensor(s_), 0),
                                                torch.from_numpy(np.array([a])),torch.from_numpy(np.array([r],dtype=‘float32’)))#
        self.position = (self.position + 1) % self.capacity

    def get_sample(self,batch_size):
        sample = random.sample(self.memory,batch_size)
        return sample

    def learn(self):
        if self.learn_step_counter % TARGET_NETWORK_REPLACE_FREQ == 0:
            self.target_net.load_state_dict(self.net.state_dict())
        self.learn_step_counter += 1

        transitions = self.get_sample(BATCH_SIZE)
        batch = Transition(*zip(*transitions))

b_s = Variable(torch.cat(batch.state))
        b_s_ = Variable(torch.cat(batch.next_state))
        b_a = Variable(torch.cat(batch.action))
        b_r = Variable(torch.cat(batch.reward))

        q_eval = self.net.forward(b_s).squeeze(1).gather(1,b_a.unsqueeze(1).to(torch.int64))
        q_next = self.target_net.forward(b_s_).detach() #
        q_target = b_r + GAMMA * q_next.squeeze(1).max(1)[0].view(BATCH_SIZE, 1).t()
        loss = self.loss_func(q_eval, q_target.t())
        self.optimizer.zero_grad() # reset the gradient to zero
        loss.backward()
        self.optimizer.step() # execute back propagation for one step
        return loss
Transition = namedtuple(‘Transition’,(‘state’, ‘next_state’,‘action’, ‘reward’))


**3、运行结果**





还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！


王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。


对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！


【完整版领取方式在文末！！】


***93道网络安全面试题***


![](https://img-blog.csdnimg.cn/img_convert/6679c89ccd849f9504c48bb02882ef8d.png)








![](https://img-blog.csdnimg.cn/img_convert/07ce1a919614bde78921fb2f8ddf0c2f.png)





![](https://img-blog.csdnimg.cn/img_convert/44238619c3ba2d672b5b8dc4a529b01d.png)





内容实在太多，不一一截图了


### 黑客学习资源推荐


最后给大家分享一份全套的网络安全学习资料，给那些想学习 网络安全的小伙伴们一点帮助！


对于从来没有接触过网络安全的同学，我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。

#### 1️⃣零基础入门


##### ① 学习路线


对于从来没有接触过网络安全的同学，我们帮你准备了详细的**学习成长路线图**。可以说是**最科学最系统的学习路线**，大家跟着这个大的方向学习准没问题。


![image](https://img-blog.csdnimg.cn/img_convert/acb3c4714e29498573a58a3c79c775da.gif#pic_center)


##### ② 路线对应学习视频


同时每个成长路线对应的板块都有配套的视频提供：


![image-20231025112050764](https://img-blog.csdnimg.cn/874ad4fd3dbe4f6bb3bff17885655014.png#pic_center)

**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化资料的朋友，可以点击这里获取](https://bbs.csdn.net/topics/618540462)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**