python3-算法刷题-贪心算法-更新中

605. 种花问题

https://leetcode.cn/problems/can-place-flowers

假设有一个很长的花坛,一部分地块种植了花,另一部分却没有。可是,花不能种植在相邻的地块上,它们会争夺水源,两者都会死去。

给你一个整数数组 flowerbed 表示花坛,由若干 0 和 1 组成,其中 0 表示没种植花,1 表示种植了花。另有一个数 n ,能否在不打破种植规则的情况下种入 n 朵花?能则返回 true ,不能则返回 false 。

示例 1:
输入:flowerbed = [1,0,0,0,1], n = 1
输出:true

示例 2:
输入:flowerbed = [1,0,0,0,1], n = 2
输出:false

提示:
1 <= flowerbed.length <= 2 * 10^4
flowerbed[i] 为 0 或 1
flowerbed 中不存在相邻的两朵花
0 <= n <= flowerbed.length

思路:
遍历数组。如果当前index是i,数值是1,那么下一位肯定不能种,只能考虑下下一个,所以直接跳去 i + 2;如果当前数值是0,说明左邻肯定不是1,因为如果是1的话i会被跳过,那么只考虑右邻是不是0或者到达边界就好了。此时如果满足二者之一,就可以在i位种树,那么n–,并且因为i位种了,相当于i位数值是1,所以直接跳去i + 2;如果两个条件都没有满足,说明不仅当前不能种,而且因为右邻是1也不能种,所以一次要跳1 + 2 = 3,因此跳去i + 3。如果最后n <= 0,说明所有的花都种进去了,自然返回True。

class Solution:
    def canPlaceFlowers(self, flowerbed: List[int], n: int) -> bool:
        i = 0
        size = len(flowerbed)
        while i < size:
            if n == 0: return True
            if flowerbed[i] == 1:
                i += 2
            else:
                if i + 1 < size and flowerbed[i + 1] == 0 or i + 1 == size:
                    n -= 1
                    i += 2
                else:
                    i += 3
        return n <= 0

122. 买卖股票的最佳时机 II

https://leetcode.cn/problems/best-time-to-buy-and-sell-stock-ii/

给你一个整数数组 prices ,其中 prices[i] 表示某支股票第 i 天的价格。
在每一天,你可以决定是否购买和/或出售股票。你在任何时候 最多 只能持有 一股 股票。你也可以先购买,然后在 同一天 出售。
返回 你能获得的 最大 利润 。

示例 1:
输入:prices = [7,1,5,3,6,4]
输出:7
解释:在第 2 天(股票价格 = 1)的时候买入,在第 3 天(股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4 。
随后,在第 4 天(股票价格 = 3)的时候买入,在第 5 天(股票价格 = 6)的时候卖出, 这笔交易所能获得利润 = 6 - 3 = 3 。
总利润为 4 + 3 = 7 。

示例 2:
输入:prices = [1,2,3,4,5]
输出:4
解释:在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4 。
总利润为 4 。

示例 3:
输入:prices = [7,6,4,3,1]
输出:0
解释:在这种情况下, 交易无法获得正利润,所以不参与交易可以获得最大利润,最大利润为 0 。

提示:1 <= prices.length <= 3 * 10^4
0 <= prices[i] <= 10^4

思路:
如果明天比今天的价格高,就今天买明天卖,获取盈利;否则不买不卖

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        if len(prices) == 1: return 0
        ans = 0
        for i in range(len(prices) - 1):
            ans += max(prices[i + 1] - prices[i], 0)
        return ans
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
下面是一个简单的Python3代码示例,实现基于贪心策略的Q-Learning算法: ```python import numpy as np # 定义九宫格游戏的状态和动作 states = ['1', '2', '3', '4', '5', '6', '7', '8', '9'] actions = ['up', 'down', 'left', 'right'] # 定义奖励和学习率等参数 rewards = np.array([ [-1, -1, -1, -1, 0, -1, -1, 0, -1], [-1, -1, -1, 0, -1, 0, -1, -1, -1], [-1, -1, -1, 0, -1, -1, -1, 0, -1], [-1, 0, 0, -1, 0, -1, -1, -1, -1], [0, -1, -1, 0, -1, 0, -1, -1, 0], [-1, 0, -1, -1, 0, -1, -1, -1, -1], [-1, -1, -1, -1, -1, -1, -1, -1, -1], [0, -1, 0, -1, -1, -1, -1, -1, -1], [-1, -1, -1, -1, 0, -1, -1, -1, -1] ]) gamma = 0.8 alpha = 0.5 epsilon = 0.1 # 初始化Q表 q_table = np.zeros((len(states), len(actions))) # 训练Q-Learning算法 for i in range(1000): state = np.random.randint(0, len(states)) while state != 6: # 选择动作 if np.random.uniform() < epsilon: action = np.random.randint(0, len(actions)) else: action = np.argmax(q_table[state]) # 更新Q值 next_state = np.where(rewards[state, action] >= 0)[0][0] q_table[state, action] = (1 - alpha) * q_table[state, action] + alpha * (rewards[state, action] + gamma * np.max(q_table[next_state])) state = next_state # 测试Q-Learning算法 state = 0 while state != 6: action = np.argmax(q_table[state]) next_state = np.where(rewards[state, action] >= 0)[0][0] state = next_state print('Move to state', states[state]) ``` 在这个示例,我们定义了九宫格游戏的状态和动作,并设置了奖励和学习率等参数。然后,初始化Q表,并使用1000次训练迭代来更新Q值。在每一次迭代,机器人会选择一个动作,并根据当前状态和选择的动作更新Q值。最后,我们使用Q表来测试算法的性能,输出机器人移动到的最终状态。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值