自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

深度学习与计算机视觉

机器学习 深度学习 计算机视觉 Python 目标检测 语义分割 OpenCV中文教程

  • 博客(1256)
  • 收藏
  • 关注

原创 成功实现销售转化的 MLOps 策略

介绍在现代商业的动态格局中,机器学习和运营 (MLOps) 的交叉已经成为一股强大的力量,重塑了传统的销售转化优化方法。本文将带你了解 MLOps 策略在彻底改变销售转化成功方面所发挥的变革性作用。随着企业努力提高效率和加强客户互动,将机器学习技术集成到运营中成为焦点。这一探索揭示了创新策略,利用 MLOps 不仅可以简化销售流程,而且可以在将潜在客户转变为忠实客户方面取得前所未有的成功。加入我们...

2024-03-25 18:27:10 933

原创 简易零钱分类程序

本程序主要利用影像处理,以及影像色彩统计并加以分析的方式,对台币进行分类标记。预处理使用函数HoughCircles 来侦测圆边,其中大多数数值都需要手动调整来提高标记的正确率,进行消除噪声的前处理可以减少误判的情况。关于函数使用可参考以下官方网址:https://docs.opencv.org/master/da/d53/tutorial_py_houghcircles.htmlcv2.Houg...

2024-03-22 17:45:35 1001

转载 导师放养,偷偷发了顶会。。。

最近经常收到读者的留言 : 抱怨科研真是太难了,竞争压力大,导师不给指导、不开组会,一年见不到导师几次,对于论文初稿、毕业论文毫无建议!无论什么专业的研究生,面对这样的灵魂拷问,很有可能都要陷入沉思。万物皆卷的时代,升学、就业的竞争越来越激烈,想要保研、申博、进大厂,没有高质量论文在手就相当于“裸奔”!然而,导师时常无法抽出时间指导,想写论文却无人指点……没有不想顺利毕业的科研人,只是.........

2024-03-20 11:30:45 62

原创 使用AWS Fargate为OpenCV项目创建无服务器API

在这个项目中,我们将在带有Fargate的AWS无服务器容器中部署一个使用OpenCV和Flask的应用程序。无论是因为你有使用OpenCV和Flask处理项目的经验,还是因为你已经有一个应用程序在使用该堆栈运行,并且你只想将其迁移到带有容器的服务中,使用AWS都可能非常方便。AWS提供了使用云服务器部署容器的选项,或使用AWS Fargate部署无服务器选项。因此,在这篇文章中,我们将在带有AW...

2024-03-19 18:21:25 959

原创 ​使用 Numpy 进行图像处理的基础知识

三种方法是使用 python 库 numpy 打开图像:Matplotlib、Opencv 和 Pillow。Matplotlib 和 Pillow 遵循 RGB,Opencv 遵循 BGR 。安装库并导入!pipinstallpillow!pipinstallmatplotlib!pipinstallopencv-pythonimportmatplotlib.pyplot...

2024-03-15 18:51:57 859

原创 【AAAI2023】痛定思痛:一种半监督的持续学习方法,用于监督有限的text-to-SQL任务流...

论文标题:Learn from Yesterday: A Semi-supervised Continual Learning Method for Supervision-Limited Text-to-SQL Task Streams论文链接:https://arxiv.org/abs/2211.11226代码:暂未开源引用:Chen Y, Guo X, Wu T, et al. Learn ...

2024-03-11 18:37:53 435

转载 CVPR2024满分论文出炉!这些方向爆火!

计算机视觉(CV)一直是目前深度学习领域最热的研究领域,其是一种交叉学科包括计算机科学,从刚出炉的CVPR2024来看,目标检测、三维重建、自动驾驶、SAM、图像分类等依旧是时下大热门!为了让大家进一步了解CV热门领域,我们联合高校教授、博导、顶会审稿人/workshop、大厂算法研究员,打造了2024CV最新热点系列课程,包含SAM、自动驾驶、三维重建、AIGC等热门方向,更有经典CV论文带读课...

2024-03-08 11:28:30 261

转载 多篇综述理清知识图谱现状,这167篇论文值得一读!

以GPT为代表的大模型,是全新一代知识表示和调用方式,相比以往知识图谱的方式,更加高效智能可扩展等,开启通用人工智能之门。但符号化的知识图谱过时了吗?并非如此,大语言模型和知识图谱不是互相替代,而是相互依存的关系,知识图谱和大模型可以进行很好的结合,互相促进,提升知识利用的效果。(文末送书)这次我整理了5篇最新知识图谱综述论文+ 10篇最新KG+sora论文+ 152篇知识图谱论文+ 2节顶...

2024-03-07 11:31:41 52

原创 【AAAI2023】基于神经跨度的持续命名实体识别模型

论文标题:A Neural Span-Based Continual Named Entity Recognition Model论文链接:https://arxiv.org/abs/2302.12200代码:https://github.com/Qznan/SpanKL@inproceedings{zhang2023spankl,title={ANeuralSpan-BasedCon...

2024-03-06 20:04:03 946

转载 终于被CCF A类会议AAAI录用了!

当代科研人现状:导师放养,但要求的工作量却一样不少,开始害怕写不完影响自己毕业;比放养更离谱的是导师课题乱指导、数据不把关、实验做不出来不让改条件...同组卷生卷死,而自己想发高质量的sci论文,却苦于没有idea,不知从何下笔...尤其是这个人人惶恐又内卷的时代,想要抓住点什么来增强安全感。有一份拿得出手的成绩——发论文的数量和质量无疑是最好的背书。手握一篇甚至多篇高质量的论文,就是学术成果最好...

2024-03-05 11:30:31 42

原创 图像分类任务:识别蜜蜂种类

问题:机器能否识别蜜蜂是蜜蜂还是大黄蜂?这些蜜蜂有不同的行为和外观,但考虑到背景、位置和图像分辨率的多样性,机器区分它们可能是一个挑战。能够从图像中识别蜜蜂物种是一项最终将使研究人员能够更快、更有效地收集现场数据的任务。授粉蜜蜂在生态和农业中都发挥着至关重要的作用,而蜂群崩溃失调等疾病威胁着这些物种。识别野外不同种类的蜜蜂意味着我们可以更好地了解这些重要昆虫的流行和生长。本文记录了加载和处理图像,...

2024-03-04 18:05:07 807

原创 Gradient AI Cloud 上的 LLAMA2 模型自动微调

介绍欢迎来到大型语言模型( LLM )的世界。过去,迁移学习是深度学习中最常用的概念。然而,2018年,《Universal Language Model Fine-tuning for Text Classification》论文改变了自然语言处理( NLP )的整个格局。本文探讨了使用微调和迁移学习的模型。LLAMA2 是用于文本生成的最佳 LLM 模型之一。在本指南中,我们将探索使用个人数据...

2024-02-21 17:59:53 1162

原创 【ICML2023】在持续学习中对生成式回放器进行投毒以促进灾难性遗忘

论文标题:Poisoning Generative Replay in Continual Learning to Promote Forgetting论文链接:https://icml.cc/virtual/2023/poster/24395代码:暂未开源引用:Kang S, Shi Z, Zhang X. Poisoning generative replay in continual le...

2024-02-01 19:12:15 655

原创 【AAAI2023】文本分类:基于轻量级快照的高效持续学习方法

论文标题:Effective Continual Learning for Text Classifcation with Lightweight Snapshots论文链接:https://ojs.aaai.org/index.php/AAAI/article/view/26206代码:https://github.com/LorrinWWW/Snapshot引用:Wang J, Dong D...

2024-01-31 18:38:00 1096

转载 【ICML2023】原型样本关系蒸馏:面向无回放的持续学习

论文链接:https://proceedings.mlr.press/v202/asadi23a.html代码:暂未开源引用:Asadi N, Davari M R, Mudur S, et al. Prototype-sample relation distillation: towards replay-free continual learning[C]//International Con...

2024-01-26 18:28:57 166

原创 大型语言模型对医学文本分析的影响

介绍在科技革命的时代,人工智能与医疗保健的融合正在重塑医疗诊断和治疗的格局。这一转变背后的无声英雄之一是大型语言模型(LLM)在医疗、健康领域尤其是文本分析中的应用。本文深入研究了基于文本的医疗应用背景下的 LLM 领域,并探讨了这些强大的人工智能模型如何彻底改变医疗保健行业。学习目标了解大型语言模型 (LLM) 在医学文本分析中的作用。认识到医学成像在现代医疗保健中的重要性。确定医疗保健领域医学...

2024-01-25 16:57:23 957

转载 今年这个方向在计算机顶会上杀疯了!

随着互联网技术的不断进步,不断有研究者将新的模型和算法应用到计算机视觉领域。计算机视觉所处理的问题越来越丰富,目前主流的计算机视觉任务,主要包括三维重建、目标检测、图像分割、OCR、视频分析和图像生成等。那么,在CV飞速发展的当下,如何更好地抓住机会,了解热点方向?本次,我复盘并整理了CV领域学习脉络,整理了一份由多位CV领域顶尖导师授课资料包,包含CV时下热点方向24节系列课程、从复现CVPR ...

2024-01-22 15:33:03 101

原创 通过Self-Purified Replay的回放方法在噪声数据流上进行持续学习

论文标题: Continual Learning on Noisy Data Streams via Self-Purified Replay论文链接:https://openaccess.thecvf.com/content/ICCV2021/html/Kim_Continual_Learning_on_Noisy_Data_Streams_via_Self-Purified_Replay_IC...

2024-01-18 18:59:27 490

转载 100+目标检测必备论文,建议收藏!

目标检测是CV领域最广的一个算法。本文整理了三大顶会CVPR、ECCV、ICCV中85篇目标检测论文与代码;系统梳理YOLOv1-YOLOv8论文及代码;12大必备YOLO项目;以及20条常用小样本目标检测方法汇总。合集下载地址在下文二维码。85篇顶会论文与代码目标检测顶会热门研究可分为3D目标检测、视频目标检测、异常检测等17个细分领域。相关85篇论文及代码已经整理完毕,大家可以扫码下载。长按二...

2024-01-17 11:31:06 66

原创 Python 中的结构化 LLM 输出存储和解析

介绍生成式人工智能目前在世界各地得到广泛应用。大型语言模型能够理解用户所提供的文本并在此基础上生成文本,这导致了从聊天机器人到文本分析器的众多应用。但这些大型语言模型通常以非结构化方式按原样生成文本。有时我们希望 LLM 生成的输出采用结构格式,例如 JSON(JavaScript 对象表示法)格式。假设我们正在使用 LLM 分析社交媒体帖子,并且我们需要代码本身中 LLM 生成的输出作为 JSO...

2024-01-16 18:01:04 1320

原创 使用 Langchain 和 Ollama 的 PDF 聊天机器人分步指南

介绍在技术不断改变我们与信息交互方式的时代,PDF 聊天机器人的概念将便利性和效率提升到了新的水平。本文深入探讨了使用 Langchain 和 Ollama 创建 PDF 聊天机器人的有趣领域,其中只需最少的配置即可访问开源模型。告别框架选择和模型参数调整的复杂性,我们踏上释放 PDF 聊天机器人潜力的旅程。了解如何无缝安装 Ollama、下载模型以及制作 PDF 聊天机器人,为你的查询提供智能响...

2024-01-15 16:53:29 6633 1

原创 VQACL:一种新颖的视觉问答持续学习设置

引用:Zhang X, Zhang F, Xu C. VQACL: A Novel Visual Question Answering Continual Learning Setting[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023: 19102-19112....

2024-01-10 18:23:53 950

转载 年终盘点!最新顶会论文合集(含AAAI24、CVPR、ECCV、NIPS、ACL、ICML等)

AAAI2024放榜后,今年的主要顶会的录用结果基本全部发布。我花了3个月的时间整理了包括AAAI2024、CVPR 2023、ECCV 2023、ICML 2023、ICLR 2023、NeurIPS 2023、ACL 2023、EMNLP 2023、AAAI 2023、WWW 2023等顶会在内的超过20000篇人工智能优质论文,今天一次性分享给大家。为了方便大家阅读,我把各大顶会的论文整理打...

2024-01-09 11:30:23 3697

转载 三个月!被CCF A类会议AAAI录用了

当代科研人现状:导师放养,但要求的工作量却一样不少,开始害怕写不完影响自己毕业;比放养更离谱的是导师课题乱指导、数据不把关、实验做不出来不让改条件...同组卷生卷死,而自己想发高质量的sci论文,却苦于没有idea,不知从何下笔...这些情况并不少见,而且并不是只有科研新手才会出现这样的情况。其实这些情况最关键的问题就在于你并未真正了解如何做科研写论文,如果你了解了科研及论文的框架和写作技巧,就能...

2024-01-08 11:40:16 88

转载 Transformer在计算机视觉领域,到底是不是顶流?

Transformer是一种新型的神经网络架构,用于处理多种感知模态数据(如图像、文本、音频等)等。它的出现,不仅让NLP变了天,成为自然语言领域的主流模型,还成功跨界CV,给AI界带来了意外的惊喜。我们邀请到哈工大计算机博士,多篇顶会一作作者李老师为大家带来——引爆顶会的transformer进阶之路,深入探索研究人员是如何改进和扩展这一架构的。扫码免费参与课程赠导师推荐100+多模态论文&am...

2024-01-04 11:40:23 111

转载 基于神经网络的浮游植物种类图像分类

地球上的海洋是环境中最有趣和生物活跃的部分之一。不幸的是,这些区域的极端压力和温度等条件使得收集关于这些生态系统的信息变得困难。这一挫折使得分析数据并在海洋中的生物学和水生生物方面得出结论变得具有挑战性。然而,最近的研究表明,水中的细菌存在,特别是称为浮游植物的单细胞生物的存在,可以帮助我们了解海洋活动和生态系统。由于浮游生物位于水生食物链的底部,这些细菌的不同物种可能对水下系统产生深远影响,并且...

2023-12-22 18:18:36 151

转载 Kaggle比赛最全学习手册!(含近500+比赛top方案+近五年kaggle比赛baseline+13本电子书+6节配套课)...

Kaggle是全球顶级的数据科学竞赛平台,在数据科学领域中享有盛名。上百万的的数据科学家及相关从业者基于企业和研究者在Kaggle上发布的数据进行数据建模、分析,相互竞争以产生最优的模型。对于很多科研专业的同学而言,打Kaggle比赛不仅可以利用比赛资源,还可以有利于个人背书!这次我整理了kaggle solution上的近500场比赛top方案+近五年比赛的baseline+6节比赛入门进阶课(...

2023-12-21 11:40:40 231

原创 训练 YOLOv8 实例分割模型

YOLOv8 是于2023年1月10日推出的。截至目前,它是计算机视觉领域中用于分类、检测和分割任务的最先进模型。该模型在精度和执行时间方面都优于所有已知模型。YOLOv8 与其他 YOLO 模型(来自 ultralytics)的比较 与以往所有的 YOLO 模型相比,ultralytics 团队在使该模型更易于使用方面做得非常出色,你甚至不再需要克隆 git 存储库!创建图像数据集在本文中,我创...

2023-12-20 16:19:07 1169

原创 理解 U-Net

目录任务概述编码器-解码器跳跃连接实现细节损失函数上采样方法是否填充?U-Net 的运作方式任务概述U-Net 是为语义分割任务开发的。当神经网络接受图像作为输入时,我们可以选择一般性地分类对象或按实例分类。我们可以预测图像中包含的对象(图像分类),所有对象的位置(图像定位/语义分割),或个别对象的位置(对象检测/实例分割)。下图显示了这些计算机视觉任务之间的差异。为了简化问题,我们仅考虑一个类别...

2023-12-18 17:48:03 926

原创 使用SHAP调试PyTorch图像回归模型

自动驾驶汽车让我感到恐惧。这些巨大的金属块在没有人类干预的情况下四处飞驰,如果出现问题,没有人能够制止它们。为了降低这种风险,仅仅评估驱动这些汽车的模型是不够的。我们还需要了解它们是如何进行预测的。这是为了避免任何可能导致意外事故的边缘情况。好吧,我们的应用程序并不那么重要。我们将调试用于驱动小型自动驾驶汽车的模型(你所能期望的最糟糕的情况可能只是扭伤了脚踝)。不过,IML方法可能会有所帮助。我们...

2023-12-15 18:04:50 1574

转载 157篇Agent论文,助你打赢大模型下半场

Agent是大模型现在最火热的一个方向,没有之一。OpenAI联合创始人Andrej Karpathy宣布,AI Agent是下一个发力方向;比尔·盖茨发文表示5年内Agent将大行其道。大厂纷纷入局Agent,大模型的下半场比赛正式开始。为什么大模型刚流行不久,就需要Agent?因为LLM目前还有幻觉、虚假、过时等问题。Agent以LLM为大脑驱动,能克服LLM的局限性,主动完成更复杂的任务。A...

2023-12-14 11:40:41 87

原创 图像混合(CV-03)

动机在现代世界中,有成千上万的工具,可以轻松地对图像进行编辑、调整大小、改变、添加不同的效果等操作。但我们很少关心它在后台是如何工作的。本文将讨论一种重要的图像处理技术,称为混合和粘贴图像。这种知识对图像处理和计算机视觉都至关重要。尽管这些技术很简单,但它们是计算机视觉的核心基础之一。如果你是图像处理和计算机视觉的初学者,本文可能对你有所帮助。目录 什么是图像混合?何时需要混合?使用OpenCv进...

2023-12-13 18:08:38 950

原创 深入了解ViT模型的代码

视觉变换器(ViT)标志着计算机视觉演进的一个显著里程碑。ViT挑战了传统的观点,即图像最好通过卷积层进行处理,证明了基于序列的注意机制可以有效地捕捉图像中复杂的模式、上下文和语义。通过将图像分解为可管理的补丁并利用自我注意力,ViT捕捉了本地和全局关系,使其能够在各种视觉任务中表现出色,从图像分类到物体检测等等。在本文中,我们将深入探讨ViT分类的内部工作原理。引言ViT的核心思想是将图像视为一...

2023-12-12 18:35:25 887

转载 终于发表了一篇CVPR!

提到计算机视觉(CV),大多数人脑海中会立马浮现出一个字:“卷”,它是一门将人类的视觉能力赋予机器的学科,涵盖了图像生成、图像识别、医学图像、自动驾驶、连续学习、工业视觉、三维重建等众多热门领域。为了让大家进一步了解CV热门领域,我们联合QS前50博士大牛,多篇顶会一作作者,打造了计算机视觉热门系列课程,包含图像生成、医学图像、三维重建等热门方向,原价699元,限时免费领!扫码免费领取课程赠导师...

2023-12-08 11:31:00 85

转载 终于找到多模态Kaggle的通关教程了!

近三年的顶会上,多模态论文占比增长迅速,最高超10%。在后GPT时代,多模态极有可能是科研与工程领域最大的机会。小伙伴们早一天入门多模态,就能让自己多一些领先,更能让自己在未来多一份竞争力。我为大家分享一个4节基础课与14节Kaggle全程实战课(含全部课件、代码、数据集)的多模态系列课程。并为你配套195篇多模态论文与272页《多模态深度学习》综述书PDF。课程原价是196元,我的粉丝们限时0....

2023-12-07 11:40:13 130

原创 使用 xeye Python 包创建用于深度学习的监督数据集

在撰写硕士学位论文时,花了很多时间研究深度学习原理和主要模型架构。在那段时间,经常思考在不同于MNIST数据集或CIFAR-10的数据(例如图像)上试验模型架构的必要性。因此,开发了一个名为xeye的小型 Python 包,它有助于创建类似于MNIST和CIFAR-10的监督图像数据集。什么时候开始使用xeye?那段时间,在对 toy 数据集进行研究和实验之后,会先到外面去寻找我所在地区可以作为案...

2023-12-06 18:03:41 1005

转载 综述 | 基于导师放养的论文投稿策略

前几天,有个粉丝在后台给我留言,他说:“开学了,不知道大家的论文都写得怎么样了?我现在是恨不得克隆十个自己,一个泡在实验室盯实验结果,一个去写月底要送审的稿子.....可现实是只有一个我,只能天天熬夜。他不是个例,成千上万的科研人都要面对无尽的实验、反复修改的论文。我们都知道写论文最头疼的不是事情多,是那些没有任何操作性可言的「重复劳动」。一整天下来,全在找梯子、找文献、找前沿成果,然后还要打包下...

2023-12-04 11:40:58 90

转载 使用 Torch 实现回归问题

在这篇博文中,我们将探讨线性回归的概念以及如何使用 PyTorch 实现它。回归是一种基本的统计建模技术,用于建立因变量与一个或多个自变量之间的关系。我们将使用 PyTorch(一种流行的深度学习框架)来开发和训练线性回归模型。你可以在此处找到有关线性概念的更多详细信息:https://korlakuntasaikamal10.medium.com/understanding-linear-reg...

2023-11-30 18:26:51 93

转载 谷歌新”蒸馏法“火了!模型准确率翻倍

模型蒸馏是一种新型的深度学习技术,旨在将复杂模型的知识迁移到小型模型中。这种技术被广泛应用于各种领域,如自然语言处理、计算机视觉和语音识别等。我们邀请到中科院博士,多个计算机国际竞赛获奖者H老师为我们带来——小模型大智慧:模型蒸馏助力AI算法性能优化,为我们详解蒸馏模型在各方向的无限潜力。免费参与课程(赠老师授课PPT)领100+篇深度学习,蒸馏模型论文合集(文末有福利)导师介绍:H老师-毕业于中...

2023-11-29 11:30:25 166

原创 如何使用 Python(NumPy 和 OpenCV)对图像进行 Funkify

如何使用 Python(NumPy 和 OpenCV)对图像进行 Funkify作者|Luke Tambakis编译|Flin来源|medium在这篇博客中,我将解释如何制作一个 Python 脚本来使用 Python 代码“funkify”图像。该程序速度足够快,甚至可以处理实时视频(无需 GPU)!像这样:如果你对枯燥的代码解释不感兴趣,只想自己尝试一下,最简单的方法是使用FunkyCam存储...

2023-11-28 20:17:01 399

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除