数组搜索+python课后小作业

这篇博客探讨了一道Python课后作业,涉及创建一个5x5的网格世界,通过不同的行为奖励和惩罚寻找最佳策略。博主在解决问题时遇到了`UnboundLocalError`和`TypeError`,并通过声明全局变量和避免函数名与变量名冲突解决了问题。最终得分12,并邀请其他Python学习者一起交流进步。
摘要由CSDN通过智能技术生成

 创建一个5*5网格世界,遵守以下规则:对不同行为进行奖励和乘法,选出最优的方案。

题目: 

思路:

编写程序解决问题的步骤:

        首先理解问题,将问题拆分,表达出每个部分的意思。

        联系各个部分,考虑特殊情况, 编写代码。

        不断修改,直到自己觉得np就OK。

代码:

# -*- coding: utf-8 -*-
"""
Created on Mon Apr 25 10:43:07 2022
创建5*5的矩阵
    四种可能行为1234,每次行为都会得分减1
    初始位置[2,1]
    到达终点[5,5],得分加10,
    到达得分点[2,4],得分加5,同时跳到[4,4]
    障碍物[3,3],[3,4],[3,5],[4,3]
@author: lx
"""
import random
import numpy as np

'''
#生成5*5数组函数
#用numpy模块,先创建矩阵5行5列
#更改初始值为1,障碍也为1
[[0 0 0 0 0]
 [0 0 0 0 0]
 [0 0 1 1 1]
 [0 0 1 0 0]
 [0 0 0 0 0]]
'''
def array():
    arr = np.zeros((5, 5), dtype=np.int32)
    #障碍
    a
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值