- 博客(14)
- 收藏
- 关注
原创 多模态大模型(理解)入门看这一篇就好了
笔者第一次接触到understanding这个在AI领域的concept时还是在爱丁堡大学读Master时在NLU+(Natural Language Understanding)的课上,当时Professor Frank Keller在第一课对NLU的定义如下:inputoutput如何让模型去理解输入,从而去处理一些下游的任务。于是,我们很容易联想到,Multimodality Understanding的相关任务可以理解为input是多个模态的数据(例如,文本+图片),而output。
2025-05-08 17:01:32
673
原创 通透!一文搞懂大模型、机器学习与深度学习的区别!
机器学习一般只接收结构化数据的输入,如果是非结构化数据,也要转化为结构化数据,比如本案例中虽然原始输入的是一些文本,但真正输入到模型进行训练的数据已经被转化成了结构化的特征向量,如上图中的[[1, 0], [1, 1], [1, 0], [0, 1]],每一行代表的是一段文本输入转化成的的结构化输入,这里一共有四个记录。:假如大模型的预训练模型不足以满足某特定任务的要求,那么还可以针对特定任务再进行微调训练,微调训练过程等同于深度学习,即构造针对特定任务的x,y来进行深度学习的训练。
2025-04-28 11:19:14
1037
原创 GNN+Transformer的前沿进展!
近年来,因其在处理复杂数据结构和序列依赖性方面的卓越表现而受到广泛关注。这种优势使得将GNN与Transformer结合成为图表示学习领域的一个新兴且充满潜力的研究方向。通过结合这两种模型,我们不仅能够扩大模型的感受野,捕捉更复杂的图结构信息,还能强化信息传递机制,从而提高推荐系统的准确性。此外,这种结合还能简化模型结构,降低计算成本,并提升训练效率。本文精心挑选了过去两年中顶级会议和期刊上发表的的GNN与Transformer结合的创新方案,与您分享。
2025-04-27 11:50:14
947
原创 终于把卷积神经网络算法搞懂了!!
今天给大家分享一个强大的算法模型,卷积神经网络算法卷积神经网络算法(CNN)是一种深度学习模型,广泛应用于图像处理、计算机视觉和自然语言处理等领域。CNN 通过模拟生物视觉系统的处理方式,能够自动从原始数据中提取特征,从而实现对输入数据的自动学习和分类。相比传统的全连接神经网络,CNN具有更高的效率和较低的计算复杂度。
2025-04-26 15:15:13
938
原创 基于深度学习的轮胎缺陷检测系统
由于全球制造业面临着在最短的时间内向市场推出多种最高质量产品的压力,因此所有职能向人工智能驱动的自动化的转变已成为必然。在质量检测方面,人工智能驱动的计算机视觉系统已经能够简化生产流程,使产品符合公司制定的质量标准。这反过来又带来了更高效率、更低运营成本的优势,同时实现 24/7 生产和更快的决策。全球轮胎制造商一直是质量保证等各个领域人工智能技术的早期采用者之一。人工智能的主要应用之一是使用基于深度学习的计算机视觉系统进行轮胎缺陷检测。
2025-04-25 10:51:58
610
原创 YOLOv8+ Deepsort+Pyqt5车速检测系统
该系统通过YOLOv8进行高效的目标检测与分割,结合DeepSORT算法完成目标的实时跟踪,并利用GPU加速技术提升处理速度。系统支持模块化设计,可导入其他权重文件以适应不同场景需求,同时提供自定义配置选项,如显示标签和保存结果等。随着城市交通压力的增加,智能交通系统(ITS)成为缓解交通拥堵、提高道路安全的重要手段。车辆检测与测速作为ITS的核心模块之一,对提升交通管理效率具有重要意义。YOLOv8和DeepSORT作为当前目标检测与跟踪领域的领先算法,其结合使用能够显著提升系统的实时性和准确性。
2025-04-24 11:26:12
711
原创 终于把 Transformer 算法搞懂了!!
大家好,今天给大家分享一个强大的算法模型,Transformer 是一种基于自注意力机制(Self-Attention Mechanism)的深度学习模型,最初由 Vaswani 等人在 2017 年的论文《Attention is All You Need》中提出。
2025-04-23 12:02:52
798
原创 CVPR 2025 即插即用卷积-自适应矩形卷积!
本图通过四个子图(a、b、c 和 d)直观地展示了四种不同类型卷积核的工作原理,对比了标准卷积、可变形卷积、多尺度卷积以及本文提出的自适应矩形卷积(ARConv)之间的区别和优势。通过动态调整卷积核的高度、宽度和采样点数量,ARConv 能够更好地适应遥感图像中不同大小和形状的目标,从而实现更高效的特征提取和更优的图像融合效果。传统的卷积操作中,卷积核的形状是固定的(通常是正方形),而 ARConv 能够自适应地学习卷积核的高度和宽度,使其能够根据图像中不同物体的大小动态调整卷积核的形状。
2025-04-22 11:43:06
752
原创 新手小白彻底搞懂!!!深度学习框架PyTorch
PyTorch 是一个用于机器学习和深度学习的开源深度学习框架,由 Facebook 于 2016 年发布,其主要实现了自动微分功能,并引入动态计算图使模型建立更加灵活。
2025-04-21 11:23:43
957
原创 复杂网络特征提取-节点特征、边特征和图整体特征
节点的度(Node Degree)是图论和网络分析中的一个基本概念,它指的是与一个节点直接相连的边的数量。
2025-04-19 10:55:01
863
原创 机器学习特征工程,全面指南!
这可以通过sklearn的多项式特征轻松实现,它生成一个新的特征集,由所有特征的多项式组合组成,其次数小于或等于指定的次数。注意:在使用卡方检验或单变量选择方法时,要记住一件事,即在非常大的数据集中,大多数特征将显示较小的p值,因此看起来它们具有很高的预测性。该模型在训练和测试数据上都显示出很好的结果,但事实上,这不是因为你的模型真的具有良好的泛化能力,而是因为它使用了测试数据中的信息。因此,你需要密切关注并监控,不要将惩罚设置得太高,以至于删除甚至重要的特征,也不要设置得太低,以至于不删除不重要的特征。
2025-04-18 11:31:06
840
原创 终于把卷积神经网络算法搞懂了!!
今天的分享就到这里。今天给大家分享一个超强的算法模型,卷积神经网络算法是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。CNN 的核心思想是通过模拟生物视觉皮层的工作原理,通过利用局部连接和共享权重的方式,使得网络能在图像中捕捉到空间和局部的特征,这使得它在图像分类、目标检测等任务中表现出色。卷积神经网络算法的基本结构卷积神经网络算法主要由卷积层、池化层和全连接层组成。
2025-04-16 17:41:28
1007
原创 精准拿捏—人工智能学习路线【快速上手】
编程语言是实现源码功能的基础,也是调试、理解代码的必要条件,人工智能相对依赖的语言是Python,其次是C++,如果你有相关的语言基础,可以直接进入后续的路线,如果你完全没有接触过编程语言,则需要先快速了解Python基础及其工具包,了解列表、字典、集合等数据类型,判断语句、循环语句结构,以及函数和类等,熟悉Numpy、Pandas对数据的处理操作,以及Matplotlib、Seaborn对数据可视化的操作,便于后续理解代码和问题查询。熟悉人工智能领域的基础概念和一系列的专业名词,以下是详细内容介绍~
2023-02-03 15:08:14
148
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人