自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 MAC(Micro-Action Analysis Grand Challenge)总结

6月24号——6月31号:这周基本事情都忙的差不多了,开始慢慢进入正轨,终于把我那个弟弟送走了,结果后面还帮他参考填志愿,这周就是提取video swin trnasformer的特征,我去,这个又是一个坑,我根据它的readme.md文件,提特征,它自己写了要提光流特征,结果它自己代码又没用到,浪费我时间,不过还好是cpu上面搞的,没有话太多时间再上面,开始做了实验,之前就提过clip跟blip256的特征,这次就拿他们的特征做实验,实验开始有了一点提升,本来以为是开始,没想到是巅峰。

2024-07-10 11:02:36 500 1

原创 文本视频检索4:Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval

首先,它图片是为只有一帧的视频,然后也是采用VIT的视频编码过程(二维),在这个基础上,每个patches加入了时间信息与空间信息,最后通过自注意力模块来得到结果。1) 现在的数据集如100M含有大量噪声,因此给出了一个新的数据集。序列编码器就是调包,使用transformer的几个函数。2) 提出了一个可以大规模使用图片与视频的模型。

2023-11-02 13:02:52 166

原创 文本视频检索3(CLIP4Clip: An Empirical Study of CLIP for End to End Video ClipRetrieval)

这个文章最主要的贡献就是把CLIP模型应用到文本视频检索领域,以及设计出了几种新型的相似函数。我们可以借鉴一下他的创新过程,可以感受到A+B的强大魅力。他们最后的方式都是一样,但是有一些在计算之前,对visul向量有不同的操作,分别是什么都不做,LSTM,2) 相似函数,提出了三种,其实严格意义来说,使用四种。文本encoder 就是直接使用CLIP的文本编辑器。提出了两种编码方式,一个就是2D,另外一个就是3D。1) 视频encoder 以及文本encoder。之后他们的才做都是一样的,

2023-10-30 20:02:53 190 1

原创 文本视频检索2(Learning Joint Embedding with Multimodal Cues forCross-Modal Video-Text Retrieval)

然后这个文章就是就是提出了一个双通道,首先一个就是将appearance feature 与 sentence feature 相融合得到一个最终特征,然后另外一个就是先将 motion feature 与 audio feature 相融合,得到一个特征,然后将这个特征再与sentence feature相融合,得到一个最终特征,这两个最终特征相融合,去做预测的。S(v,t) 就是正样本, S(v,t一撇) (那个撇我不会打)就是负样本,一般的就是正负样本直接求和,但是这个它只关心那个最难识别的负样本。

2023-10-20 22:34:28 122 1

原创 二分一套模板搞定

我们可以把他们认为是一个红蓝区间,于是问题就变成了,在这个红蓝区间内中边界值了,我们可以根据具体的情况放回l,r。因为l/r是属于不同红蓝区域的。

2022-11-18 10:47:25 92 2

原创 序列DP P375

这道题目,看一眼就知道是一个DP,但是状态搞错了,然后就写了好久,都没有写出来,看了一下题解,瞬间恍然大悟,隔了一天再去写,一下子就写出来了。但是我是想用dp[i][0] 就去代表从1 到 i 的最小数值,状态没有跟上来,而且最近这种dp没有怎么做,就忘了。原因:我把状态想简单了,应该是dp[i][j] 对应i 到 j 的最小数值,

2022-11-07 19:49:58 71

原创 堆栈的理解Leetcode P496 P6227

从左往右遍历 \textit{nums}nums,用(递减)单调栈 ss 记录元素,如果 x=\textit{nums}[i]x=nums[i] 比 ss 的栈顶大,则 xx 是栈顶的下个更大元素,弹出栈顶。把弹出的元素加到另一个栈 tt 中(注意保持原始顺序),后续循环时,如果 y=\textit{nums}[j]y=nums[j] 比 tt 的栈顶大,则 yy 是栈顶的下下个更大元素,记录答案,弹出栈顶。算法是一个将理解的东西,这两题可以说对堆栈的理解是一个高级层面了。

2022-10-31 16:36:33 282

原创 数位DP(1)不含连续1的非负整数

我和官方题解的只要区别: 我考虑的是最高为1,然后举例后位为0的,但官方为举例为后位为1的,就是这一个区别,导致我的代码极其麻烦。最高位为 0 的 0 1w。给定一个正整数 n,找出小于或等于 n 的非负整数中,其二进制表示不包含。与我的大体一样,但它是列举最高位为1/0,长度为n的所有数的个数。感觉思路上大体都对了,后面还要再努力,应该就可以写出来了。但后面不好写了,就是我这样子考虑情况太多了,搞不懂。例如: 长度为2,最高位为1的:1 0 10。Tag : 「数位 DP」第二类:0 1 10。

2022-10-18 10:46:03 113

原创 python版哈希表 defaultdict

刚刚开始转python ,在写算法题的时候,发现它的用法与哈希表很像,但比哈希还要方便(神器啊)接受一个类型对象或函数对象,在取值时,如果不存在对应的。

2022-10-14 16:57:39 282

原创 LSC模板(最长公共子序列)

(如果从字符串 T 中删除一些字符(也可能不删除,并且选出的这些字符可以位于 T 中的 任意位置),可以得到字符串 S,那么 S 就是 T 的子序列)看到这道题目的最开始思路为 首先要找到他们的最长子序列,然后在这个基础上面进行拼接,把str1与str2的没有部分拼上。否则 f[i][j] = Math.max(f[i-1][j] , f[i][j-1]);f[i][j] i代表str1的前i个字符,j代表str2的前j个字符。这样子我们就找到了他们的最长子序列,接着上代码。

2022-09-28 11:46:32 212

原创 完全背包求方案数 例题

1449. 数位成本和为目标值的最大数字给你一个整数数组cost和一个整数target。请你返回满足如下规则可以得到的最大整数:给当前结果添加一个数位(i + 1)的成本为cost[i](cost数组下标从 0 开始)。总成本必须恰好等于target。添加的数位中没有数字 0 。由于答案可能会很大,请你以字符串形式返回。如果按照上述要求无法得到任何整数,请你返回 "0" 。示例 1:输入:cost = [4,3,2,5,6,7,2,5,5], target...

2022-05-31 17:24:13 97

原创 分组背 包

分组背包的例题:给定 N个物品组,和容量为 C的背包。第 i个物品组共有 S[I] 件物品,其中第 i 组的第 j 件物品的成本为v[i] ,价值为 w[i]。每组有若干个物品,同一组内的物品最多只能选一个。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容输入输入:N = 2, C = 9, S = [2, 3], v = [[1,2,-1],[1,2,3]], w = [[2,4,-1],[1,3,6]]输出:10分组背包从本质上来说,与之前说过的多重背包的思维,技巧

2022-05-29 10:59:56 58

原创 背包之树形背包

树形背包——是背包的一种,它的特征是物品之间会有依赖关系,必须要先选一个物品,再选一个物品。如果选择一个物品,则必须选择它的父节点。第 i 件物品的体积为v[i] ,价值为 w[i],其父节点物品编号为p[i] ,其中根节点p[i] = -1 。求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且总价值最大。在这个之前,我们要有一些基本知识;链式向前星存图:它的作用就是可以快速找到一个节点的所有子节点,与我们之前拿二维数组存储,优点是内存小,且速度也要快。 void

2022-05-27 23:56:21 1040

原创 DP 与回溯的 经典题目

Leetcode 131(感谢三叶姐)给你一个字符串 s,请你将 s 分割成一些子串,使每个子串都是「回文串」。返回 s 所有可能的分割方案。回文串 是正着读和反着读都一样的字符串。输入:s = "aab"输出:[["a","a","b"],["aa","b"]]求所有的分割方案,凡是求所有方案的题基本上都没有什么优化方案,就是「爆搜」。问题在于,爆搜什么?于是为了优化,我们先将所以dp[i][j] 的情况先预先出来好,之后,在进行减枝的爆搜。代码如下:class

2022-05-20 17:04:58 69

原创 多重背包 问题

0,1 背包有N件物品和一个容量是V的背包。每件物品有且只有一件。第 i 件物品的体积是v[i] ,价值是 w[i] 。这类问题就是背包里的物体每次只能选一次,是比较简单的class Solution { public int maxValue(int N, int C, int[] v, int[] w) { int[] dp = new int[C + 1]; for (int i = 0; i < N; i++) {

2022-05-18 10:55:56 116

原创 对于二分的理解(2)

对于二分的写法,题目往往难的不是如何写出二分,而是怎么发现二分,并且对于二分的一些特殊情况要可以分析到。此时对于二分有两套模板,而我在这里应该说是推荐使用(left < right) 这种情况,因为对于(left <= right) 这种,left 与right 不相等,情况一多的话,我们自己把自己就玩晕了。现在我们来看看,经过测试,模板是有效的。lower_boundint left =0 , right = n; while(left < ri...

2022-05-17 13:09:43 68

原创 对于二分的理解

二分,现在对我而言就是有一种玄学的感觉,有些时候感觉可以做出来,但是有些时候,却无法做出来,可能因为我还是一个小菜鸡把。 经过上网搜了一些博客,第二感觉是二分也是有模板的,把模板背下来似乎就好了。现在我先把模板贴上(模板也是参考其余博主的,由于过去有那么久了,我自己都不记得抄谁的了,就不在这里说了)。最基本的二分查找算法:因为我们初始化 right = nums.length - 1 所以决定了我们的「搜索区间」是 [left, right] 所以决定了 while (left <= ri

2022-05-15 10:15:15 80

原创 dp 第一次仍存在疑惑的题目(2)

这是 LeetCode 上的「44. 通配符匹配」这道题目的困难点在于,如何找出状态转移方程。先贴上代码,等周末总结再看以后再看。感谢三叶姐class Solution { public boolean isMatch(String ss, String pp) { int n = ss.length(), m = pp.length(); // 技巧:往原字符头部插入空格,这样得到 char 数组是从 1 开始 // 而且可以使得 ..

2022-05-13 21:23:28 61

原创 序列dp题目

leetcode 354 ,这道dp 的困难的地方,不在于如何想出状态转移方程,而是如何优化状态转移方程,以及对二分的理解。(感谢三叶姐)先贴上代码:class Solution { public int maxEnvelopes(int[][] es) { int n = es.length; if (n == 0) return n; // 由于我们使用了 g 记录高度,因此这里只需将 w 从小到达排序即可 Arrays.

2022-05-13 21:20:53 48

原创 运用双向队列实时求最大值,最小值。力扣 1438

题目来源:1438. 绝对差不超过限制的最长连续子数组这道题的思路基本上是来一个滑动窗口,然后r(右窗口)每一次移动,就找到现在队伍的最大值,最小值,然后运用 (最大值- 最小值) 去判断是否符合题目条件,不是的话,就l(左窗口) 移动,知道符合条件为止,然后困难就变成了怎么在每一次移动的时候,找到最大值,和最小值。于是就需要运用双向队列。 感谢三叶姐的思路。class Solution { public int longestSubarray(int[] nums, int limit)

2022-05-07 19:32:05 276

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除