- 博客(362)
- 收藏
- 关注
原创 多模态大模型-应用小记【转载】
Qwen VL模型结构视觉编码器使用预训练的ViT-bigG(2B训练数据)过程:将图片分割成多个图像块patch(接受固定尺寸1:1),然后将patch线性映射为token,然后将token进行拼接通过卷积核将一张图片从映射成按行优先展开,reshape处理成一个二维格式的数据(类似与一条文本处理后的序列)感知位置的的视觉-语言适配器(输入投影层)单层Cross-Attention模块(随机初始化):比如将输入的1024长度,压缩为256长度注入位置编码。
2026-03-30 10:48:37
329
原创 LLM中的强化学习-应用小记【转载】
主要组件:一个智能体(agent)在某个环境(Environment)中采取动作(Action);这些动作由一个策略(policy)预测RL优化目标最大化整条轨迹上的累积奖励对所有可能轨迹的求加权和,权重就是每条轨迹出现的概率重要性采样 / 比率:作用:作用是为轨迹中的不同动作分配重要性权重被裁剪的情况(此时梯度为0,actor model不会更新当优势A(s_t, a_t)>0,且r(θ)>1+ε当优势A(s_t, a_t)<0,且r(θ)<1-ε优势估计advantage。
2026-03-18 16:48:34
30
原创 1000. 合并石头的最低成本(H)/ 1312. 让字符串成为回文串的最少插入次数(H)/ 区间DP!!!
【代码】1000. 合并石头的最低成本(H)/ 1312. 让字符串成为回文串的最少插入次数(H)/ 区间DP!!!
2024-04-24 01:04:22
322
1
原创 1293. (消除k个障碍物)网格中的最短路径(Hard)/ 174. 地下城游戏(计算骑士所需的最低生命值,Hard)/ 1368. 使网格图至少有一条有效路径的最小代价(H)/ 迷宫系列!!!
a
2023-02-15 12:44:16
296
原创 【The Linux Command Line】学习笔记
命令什么是命令相关命令type: type command,显示命令的类型which: which program,显示可执行程序(不包括内部命令和命令别名)的位置help: help command,显示shell内部命令帮助文档。对于某些可执行程序,有program --help来显示用法man: man program,是一个分页程序,用于显示手册文档;查找特定章节:man section search_term;显示关键字匹配:man -k keywordapropos: ap
2022-04-01 16:22:58
1321
原创 1552. 两球之间的磁力(Medium)/ 1648. 销售价值减少的颜色球(M)/ 二分问题!!!
668. 乘法表中第k小的数(Hard)378. 有序矩阵中第 K 小的元素(Medium)题解class Solution: def maxDistance(self, position: List[int], m: int) -> int: # 判断当前的mid是否合法:存放的下m个球 def check(x: int) -> bool: pre = position[0] cnt = 1.
2021-09-23 13:32:52
217
原创 994. 腐烂的橘子(Medium)/ 582. 杀死进程(M)/ 二维矩阵DFS、BFS、并查集问题
73. 矩阵置零(Medium)130. 被围绕的区域(Medium)934. 最短的桥(Medium)547. 省份数量、朋友圈(Medium)684. 冗余连接(Medium)题解class Solution: # BFS def orangesRotting(self, grid: List[List[int]]) -> int: row, col, time = len(grid), len(grid[0]), 0 directi.
2021-09-23 11:27:13
315
原创 763. (尽可能多地)划分字母区间(Medium)
49. 字母异位词分组(Medium)438. 找到字符串中所有字母异位词(Medium)题解class Solution: # 贪心 def partitionLabels(self, s: str) -> List[int]: # 得到每个字母最后一次出现的下标位置 last = [0] * 26 for i, ch in enumerate(s): last[ord(ch) - ord("a").
2021-09-23 10:29:00
185
原创 384. 打乱数组【逻辑实现题:重置、随机】(Medium)
题解class Solution: def __init__(self, nums: List[int]): self.array = nums self.original = list(nums) # 保存原始数组 def reset(self) -> List[int]: """ Resets the array to its original configuration and return it...
2021-09-10 13:53:05
199
原创 931.【正方形】下降路径最小和(Medium)/ 120.【三角形】最小路径和(Medium)
LeetCode 112. 路径总和(Easy)/ 113. 路径总和 II(Medium)/ 437. 路径总和 III(Medium) / 二叉树路径问题题解官方题解class Solution: def minFallingPathSum(self, matrix: List[List[int]]) -> int: n = len(matrix) # dp[j]表示从第j列下降(到某一行)得到的最小路径值 dp = [i for.
2021-09-10 00:25:03
305
原创 842. 将数组拆分成斐波那契序列(Medium)
题解class Solution: def splitIntoFibonacci(self, num): ans = [] def backtrack(idx): # 若已经到达原始字符串的长度,则表示已经拆分完 if idx == len(num): return len(ans) >= 3 curr = 0 ..
2021-09-05 13:11:47
274
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅