自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Llama3.2-vision-11B在Python上的调用

Llama-3.2-Vision对电脑性能的要求比较高,建议一开始就选用比较高配的GPU(例如A100),不然后面环境配好了会发现gpu不够支撑它。多数是如何通过ollama调用它来做一些任务执行,但是有时候需要调用一些更底层的东西就尴尬了。首先,向huggingface申请模型数据并下载,国区不要选China(原因自行脑补)。服了,找了好几天的代码就这么水灵灵地出现在huggingface官网下边。文件路径记得改为模型在本地的路径!提示词的书写是非常头疼的一步,没写好的话输出总是默认格式,跑了也是白跑。

2025-01-15 12:32:17 714

原创 保研夏令营分享

先是猝不及防开始问我dsp的知识,说看我简历上有写(所以说啊家人们简历上写的每件事每个课都要好好复习),然后问我对一些很新的cv技术的认识,包括我的项目经历。那边的老师除了早上的综合面试,也会在面试当天下午召集自己比较心动/提前联系过他们的学生去参加一个针对于导师实验室内部的面试,这样的面试一般会比较casual,也更能体现你的special。不过生源的“差”也只是和vipl对比之下,我看当时来面试的也都是211和985,甚至还有清华大佬ww这边的老师主要是围绕提交的材料问的,所以打印了我好多a4哈哈!

2024-11-15 23:57:57 140

原创 MiniGPT4部署及推理过程实现

在autodl上租用一个RTX4090的服务器,可以选择社区镜像里的minigpt4(CUDA版本为17.0,torch=2.0.1,虽然看不出作用hh)(在本地电脑尝试过11.3,11.6,11.8,12.1但都没有成功,可能是哪个环节出了问题,欢迎分享!再者便是下载一个能跨网连接之类的文件,这个文件下载需要先关闭防火墙和病毒防护!再者便是下载一个能跨网连接之类的文件,这个文件下载需要先关闭防火墙和病毒防护!(对于minigpt4,Vicuna version)接着可以开始执行代码运行命令。

2024-10-19 20:47:03 685

原创 大模型幻觉基础知识笔记

大模型已经在NLP和CV领域有巨大的贡献,它们强大的处理开放域问题的能力也在一定程度上促进了LLM产生幻觉的倾向。幻觉的分类、检测与基准以及缓解也进而成为了大模型幻觉领域的几个关键问题。下面就来具体了解和大模型幻觉相关的主要内容!

2024-10-18 15:30:14 915

原创 SAM2论文阅读

在多媒体发展迅猛的时代背景下,从时间维度实现 Segment Anything是一项颇有意义的事情。基于此,facebook便提出了SAM2,在SAM的基础上设计了在视频领域的可提示视觉分割模型,用于判断目标实体的时空范围(即新增了时间维度)。本文将就SAM2的论文进行记录,也作为自己的复习参考。

2024-08-08 23:48:36 2394 1

原创 SAM(Segment Anything)阅读笔记

作为图像分割大模型的经典代表和基础模型,SAM(Segment Anything)对于图像分割任务乃至视觉大模型都有着不可忽视的重要启蒙作用。该论文保留了当下流行且简洁的各模型对模型进行一定的创新修整,提出数据收集循环实现“数据产生数据”的伟大设想,对大数据大模型做出了极大的贡献。

2024-08-01 17:59:33 1038

原创 元学习领域的prototype介绍

在元学习框架下的原型(prototype)可以被用作快速适应新任务的关键。prototype通过在不同任务上训练实现对支持集(support set)中的新样本进行特征学习,提炼新样本信息,在不干扰既有检测模型参数的情况下以诸如挂件的形式植入检测框架中,有效避免了原模型的退化和重头训练的资源损耗,实现对新旧样本的高准确度检测.

2024-07-27 10:57:42 1357

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除