程序人生
文章平均质量分 85
普通网友
这个作者很懒,什么都没留下…
展开
-
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型,用于 3D 人类生成
StructLDM 是一个从图像、视频中学习的前馈三维生成模型(Feedforward 3D Generative Model),相比于已有 3D GAN 方法可生成高质量、多样化且视角一致的三维数字人,并支持不同层级的可控生成与编辑功能,如局部服装编辑、三维虚拟试衣等部位感知的编辑任务,且不依赖于特定的服装类型或遮罩条件,具有较高的适用性。值得注意的是,StructLDM 支持不同级别的可控 3D 人体生成和编辑,包括姿势/视图/形状控制,以及高级任务,包括构图生成、部分感知服装编辑、3D 虚拟试穿等。原创 2024-08-15 17:00:50 · 995 阅读 · 0 评论 -
强化学习中的策略梯度方法(游戏AI、机器人、自动驾驶)
选择一个参数化的策略函数,通常用神经网络来表示,该函数将状态映射到动作的概率分布。原创 2024-08-14 15:03:26 · 675 阅读 · 0 评论 -
成为AI工程师的路线图(在2024年成为 AI 工程师的技能、学习资源和项目想法)
在确定 AI 工程师如何成为下一个大型技术角色之后,是时候学习如何成为一名重要角色了。让我们先揭开路线图的面纱!原创 2024-07-24 16:25:26 · 637 阅读 · 0 评论 -
彻底理解 AdaBoost 自适应提升算法 | AdaBoost 的关键要点、基本原理、优缺点和实际应用
即自适应提升()算法的缩写,是一种基于策略的集成学习方法,旨在。AdaBoost 的 “自适应” 二字意味着它能够在每一轮迭代后调整对训练数据实例的关注度(特别是那些之前被错误预测的样本)和更新弱学习器的权重。与随机森林类似,AdaBoost 也是集成学习中的代表性算法之一,并且适用于分类和回归任务。Boosting 方法在近年来的多项数据竞赛中均取得了卓越的成绩,其背后的概念却并不复杂。该方法通过简单、易于理解的步骤构建简单的模型,进而将这些简单模型组合成强大的学习器。原创 2024-07-08 17:24:14 · 1025 阅读 · 0 评论 -
顶会宠儿:几何深度学习!将几何先验知识融入深度学习模型!读完这篇,小白也可以了解GDL!
几何深度学习的未来发展潜力巨大。随着深度学习技术的不断进步,结合几何学的深度学习模型有望在更多领域内实现突破。例如,结合无监督学习或半监督学习的几何深度学习模型可能会在不需要大量标注数据的情况下,依然能够实现高性能的学习和预测。几何深度学习以其独特的视角和方法,在机器学习领域内开辟了一条新的研究路径。它不仅丰富了深度学习的理论基础,也为解决实际问题提供了新的思路和方法。随着研究的深入,几何深度学习有望在未来的智能系统中扮演更加重要的角色。原创 2024-06-24 15:02:54 · 775 阅读 · 0 评论 -
基于深度学习的推荐系统
推荐系统是互联网时代的一项关键技术,它通过分析用户的兴趣和行为,为用户推荐个性化的内容和产品,从而提高用户的满意度和参与度。随着人工智能技术的迅速发展,特别是深度学习的广泛应用,推荐系统迎来了新的发展机遇。深度学习以其强大的特征提取和非线性建模能力,在推荐系统中扮演着越来越重要的角色。原创 2024-06-21 14:16:43 · 1049 阅读 · 0 评论 -
2024年的顶级计算机视觉机遇和挑战
计算机视觉(CV)是人工智能的一部分,它使计算机能够分析和理解视觉信息,包括图像和视频。它超越了简单的“看到”图像,而是教会计算机根据它们看到的东西做出决定。人工智能驱动的计算机视觉市场正经历快速增长,从2023年的220亿美元增长到预期的2023年的220亿美元500亿美元到2030年,2024-2030年CAGR将达到21.4%。这项技术模仿人类的视觉,但使用复杂的算法、大量数据和相机工作得更快。计算机视觉系统可以快速分析大面积上的数千种物品,或者检测人眼看不见的微小缺陷。原创 2024-06-21 13:54:04 · 868 阅读 · 0 评论 -
直观理解小样本学习
小样本学习作为一种新兴的机器学习技术,在解决数据稀缺问题方面展现出巨大的潜力。随着研究的深入,小样本学习有望在众多领域实现更广泛的应用,并为人工智能的发展开辟新的道路。原创 2024-06-05 15:20:57 · 854 阅读 · 0 评论 -
人工智能的常用十种算法
导读:人工智能是科技研究中最热门的方向之一。整理了一份关于python基础,图像处理opencv\自然语言处理、机器学习、数学基础等资源库,想学习人工智能或者转行到高薪资行业的,大学生都非常实用,无任何套路免费提供,,加我裙966367816也可以领取的内部资源,人工智能题库,大厂面试题 学习大纲 自学课程大纲还有200G人工智能资料大礼包免费送哦~1、决策树根据一些feature(特征)进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,.原创 2021-09-18 15:07:42 · 20618 阅读 · 0 评论 -
十大经典算法(图像处理)
导读:随着现代社会的发展,信息的形式和数量正在迅猛增长。其中很大一部分是图像,图像可以把事物生动地呈现在我们面前,让我们更直观地接受信息。这是小编的其他文章,希望对大家有所帮助,点击即可阅读人工智能常用的十大算法 人工智能数学基础(二)为了方便大家学习交流,我建了一个扣裙:966367816(学习交流、大牛答疑、大厂内推)另外我还整理了整整200G的人工智能学习笔记、课程视频、面试宝典一并可以无套路免费分享给大家!定义图像处理(image processing)又...原创 2021-09-29 15:41:02 · 12583 阅读 · 0 评论 -
中科院版「分割一切」Fast SAM模型 | 精度相当,速度提升50倍!目前GitHub6.9K+星
比Meta的「分割一切模型」(SAM)更快的图像分割工具,来了!中科院团队开源了FastSAM模型,能以50倍的速度达到与原始SAM相近的效果,并实现25FPS的实时推理。该成果在Github已经获得6.9K+次星标,在Twitter、PaperswithCode等平台也受到了广泛关注。原创 2024-04-30 16:47:57 · 2162 阅读 · 0 评论 -
YOLO-NAS | 新一代目标检测王者,性能比yolov8,yolov7更胜一筹!
综上所述,YOLO-NAS的训练数据集需要是格式正确、内容丰富、标注详尽的YOLO模型所支持的格式。这样的数据集不仅能为模型提供充分的训练信息,还能帮助模型在面对实际问题时展现出更好的性能和适应性。在准备数据集时,需要注意数据的质量和多样性,确保数据集能够满足YOLO-NAS训练的要求,从而让模型在实际应用中发挥出最佳的效果。原创 2024-04-30 16:30:23 · 909 阅读 · 0 评论 -
多模态学习:多模态大模型(医疗影像分析)
多模态学习允许机器从多种不同的数据源学习,例如,可以从图像和文本中同时学习,这样可以让模型更好地理解世界。它的核心在于处理和分析多源异构数据,提取深层次的概念、语境和关联性。原创 2024-04-12 11:58:42 · 2281 阅读 · 0 评论 -
YOLO-World :实时开放词汇对象检测,前沿开集目标检测器!YOLOV8/计算机视觉/深度学习
YOLO-World的实时开放词汇检测能力和优秀的性能使其成为了一个强大的工具,可用于各种需要快速准确对象检测的场景。YOLO在标准基准测试中,World 的速度和效率超过了现有的开放词汇检测器,包括 MDETR 和 GLIP 系列,展示了YOLOv8 在单个 NVIDIA V100 GPU 上的卓越性能。本节详细介绍了可用的模型及其特定的预训练权重、支持的任务以及与各种运行模式(如推理、验证、训练和导出)的兼容性,支持的模式用 ✅ 表示,不支持的模式用 ❌ 表示。可用型号、支持的任务和运行模式。原创 2024-04-08 14:50:56 · 2099 阅读 · 0 评论 -
打造你的专属大模型,学完即可使用上岗!技术人的大模型课程(人工智能/机器学习/深度学习)
在教学方面,Daniel指导的AI研究课题广泛且深入,包括图像分割、医疗报告生成、三维运动生成、多模态对话生成、视频理解及评论生成等,这些课题跨越计算机视觉、自然语言处理和多模态等多个研究方向。他在顶尖学术会议和期刊上发表了15篇以上的论文,包括但不限于ACM MM、CIKM、AAAI、ICLR和TOSEM等,并担任SOSP、ACL、EMNLP、MSR、ICSE、ICSME等多个会议的程序委员会成员或审稿人。4、社区支持与行业网络:加入我们,你将有机会接触行业大咖,参与热点话题的分享,拓宽你的职业网络。原创 2024-04-08 14:25:36 · 1109 阅读 · 0 评论 -
ICLR 2024 |冻结住的CLIP仍可作为教师模型!
不难发现,在UCF-101与HMDB-51数据集上,fine-tune模型的性能比Frozen CLIP更强,但是在Kinetics-600数据集上,fine-tune模型的实验性能却比frozen CLIP要更弱。而在与训练数据不那么相似的测试类别上,模型需要更多地依赖预训练的泛化性知识,但这些知识已经在fine-tune的过程中被逐渐抹去了(典型的灾难遗忘问题(catastrophic forgetting issue)),因此fine-tune模型性能更差。我们在两种场景下都达到了最优的识别性能。原创 2024-03-27 09:42:34 · 796 阅读 · 0 评论 -
Word2vec:词向量生成模型详解:Skip-gram和CBOW
Word2vec是一种常用的词嵌入算法,它能够将词语映射到一个连续的向量空间中,使得语义相近的词语在向量空间中的距离也相近。Word2vec包括两种模型:CBOW模型和Skip-gram模型,分别通过上下文词预测目标词和通过目标词预测上下文词。本文详细介绍了Word2vec的原理、模型结构、训练过程,并提供了Python代码实现示例。综上所述,Word2Vec是一种强大的词向量生成模型,能够为自然语言处理任务提供有力的支持。通过不断优化模型和改进训练方法,我们可以进一步提高词向量的质量和性能。原创 2024-03-21 14:28:31 · 1771 阅读 · 0 评论 -
自动驾驶方向Autonomous Driving的优质论文及其代码!PC-NeRF、3D三维重建、AoSRNet、无人驾驶技术
与精度高但重复计算的传统以代理为中心的方法以及精度和通用性受到影响的以场景为中心的方法不同,SIMPL 为所有相关交通参与者提供实时、准确的运动预测。为了提高准确性和推理速度,我们提出了一种紧凑而高效的全局特征融合模块,该模块以对称方式执行定向消息传递,使网络能够在单次前馈传递中预测所有道路使用者的未来运动,并减轻 视点移动导致的精度损失。非均匀成像介质中的光散射和衰减或光强度不一致会导致收集到的图像对比度不足和颜色失真,从而限制视觉驱动的智慧城市、自动驾驶汽车和智能机器人等领域的发展。原创 2024-03-15 14:02:08 · 756 阅读 · 0 评论 -
医学图像分割方向优质的论文及其代码【Medical Image Segmentation】UNet、transformer、计算机视觉
所提出的 WSL 策略融合了三种不同的架构但相同的对称编码器-解码器网络:用于详细局部特征提取的基于 CNN 的 UNet、用于全面全局上下文理解的基于 Swin Transformer 的 SwinUNet 以及用于高效长时长的基于 VMamba 的 Mamba-UNet。Weak-Mamba-UNet 的有效性在公开的 MRI 心脏分割数据集上进行了验证,该数据集具有经过处理的涂鸦注释,其性能超过了仅使用 UNet 或 SwinUNet 的类似 WSL 框架的性能。不方便下载的,我已整理好。原创 2024-03-13 14:47:17 · 1365 阅读 · 0 评论 -
机器学习的正则化到底是什么意思?Regularization
虽然这不是正则化的直接缺点,但在实践中采用早停法(Early Stopping)作为一种正则化手段时,它依赖于验证集的表现,并且可能受随机性影响较大,尤其是在有限数量的迭代次数或小批次大小下。综上所述,正则化是机器学习中一种强大的工具,它不仅提高了模型的泛化能力和稳定性,还提供了特征选择的可能性,并有利于优化问题的解决,进而提升整个机器学习系统的性能和实用性。总的来说,正则化是一种有效的技术,可以降低模型的复杂度,提高模型的泛化能力,从而改善模型在测试数据上的表现。原创 2024-02-22 17:02:09 · 1750 阅读 · 0 评论 -
超强总结!十大聚类算法!机器学习算法K-means、层次聚类、DBSCAN、谱聚类、高斯混合模型、模糊C-means、K-medoids、Mean Shift、OPTICS、BIRCH
不过,选择合适的簇数量和协方差类型对于获得好的聚类结果至关重要。与传统的聚类算法(如K-means)不同,谱聚类依赖于数据的相似性矩阵,并利用数据的谱(即特征向量)来进行降维,进而在低维空间中应用如K-means的聚类方法。这种算法与著名的 K-means 算法相似,但主要区别在于 K-medoids 选择数据点中的实际点作为簇的中心,而 K-means 则使用簇内数据点的均值。K-means 是一种广泛使用的聚类算法,它的目标是将数据点分组到 K 个簇中,以使簇内的点尽可能相似,而簇间的点尽可能不同。原创 2024-02-19 17:34:59 · 6070 阅读 · 0 评论 -
2023年最具影响力的 10 篇AI论文(Llama2、SAM、LLM、 Pythia、QLoRA、BloombergGPT、DPO、Mistral 7B、Orca 2、transformer)
一、Pythia — 大模型该如何训练?2023 一年又过去,这一年,AI 圈子以一种“狂飙突进”的速度飞速发展,哪怕在这个领域深耕多年的学者们也开始感叹“从没有见过哪个领域在哪一年如同 AI 领域在 2023 年这样如此飞速的发展与不断的进化”,毫无疑问,这一年 AI,尤其是大模型的爆发将会深刻影响未来我们生活的方方面面。原创 2024-01-16 17:19:29 · 1439 阅读 · 0 评论 -
研究生话题:要基于Pytorch做深度学习,如何快速提升代码能力? --人工智能/深度学习
在深度学习和计算机视觉领域,AlexNet、VGG、ResNet、Yolo和SSD都是极为重要的模型,各自代表了图像识别和对象检测领域的重要进展。为了深入理解这些模型的工作原理和应用,手写代码并亲自进行数据标记和训练是一个非常有效的学习方法。”, 其实就是一份非常有意思的 AI 大模型的介绍性入门课程,如果认真学了,你会学会关于大模型的相关知识,加薪、换工作大概率是个加分项。:这是一个强大的科学计算库,提供了大量的数学函数处理以及对大型多维数组和矩阵的支持,是深度学习中进行数学运算的基石。原创 2024-01-15 17:07:11 · 1168 阅读 · 1 评论 -
放养式图像处理方向研究生如何学习?
学习人工智能方向的语言以及框架,如TensorFlow、PyTorch等,API文档也是个不错的选择,至于网上的哪些教程,网上都能找到,没必要浪费钱了。通过网上课程、教材或教程学习图像处理的基础知识,包括数字图像处理、信号处理、线性代数和统计学等,以及一些相关的机器学习、深度学习专业知识。确定你在图像处理领域(或者说计算机视觉)的具体兴趣和目标,例如图像分割、目标检测等,最好是能够跟导师的研究方向挂钩。创建个人网站或在线作品集,展示你的项目和技能,知乎、博客、github都可。原创 2024-01-12 21:00:00 · 748 阅读 · 0 评论 -
周志华西瓜书+花书圣经+李航统计学习方法+南瓜书|四大人工智能名著分享
特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。第3部分为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;1、超详细的人工智能学习路。原创 2024-01-12 20:00:00 · 1099 阅读 · 0 评论 -
2023最具前景的研究方向之一:人工智能+计算机视觉+3D视觉
计算机视觉是人工智能领域的一个重要组成部分,它涉及使计算机能够理解和解释图像和视频数据。通过机器学习和深度学习技术,计算机视觉能够自动地完成图像分类、目标检测、人脸识别等任务,甚至超越了人类的能力。原创 2023-10-27 17:23:06 · 667 阅读 · 0 评论 -
AI+无人机方向!可以写的专业居然有这么多!人工智能毕业论文计算机视觉
特别是对于工科类的小伙伴们来说,AI无人机+专业学科,已经成为了毕业论文方向的重要选择之一,AI无人机,也是论文发表的热门选题,特别电子信息、计算机科学与技术、核电技术与控制工程、电子信息、流体力学、电气工程、船舶电子电器工程、材料、交通信息工程与控制、航空航天等专业的小伙伴来说,论文发表方向,几乎与AI“强绑定”。原创 2023-08-17 14:43:30 · 328 阅读 · 0 评论 -
强烈推荐邱锡鹏人工智能书籍《神经网络与深度学习》
“蒲公英书”——《神经网络与深度学习》原创 2023-04-26 11:26:35 · 797 阅读 · 1 评论 -
AutoGPT爆火,GitHub上已有42k星标,打造一款属于自己的AI助手,什么是全自动AI?ChatGPT已过时?
GitHub上线了一个新的基于GPT-4的开源应用项目AutoGPT,凭借超42k的Star数在开发者圈爆火。原创 2023-04-14 15:28:38 · 5484 阅读 · 0 评论 -
CV不存在了?Meta推出最新AI模型SAM,计算机视觉领域的ChatGPT
Facebook母公司Meta在推特宣布推出SAM模型(Segment Anything Model)并开源原创 2023-04-11 14:47:13 · 592 阅读 · 0 评论 -
计算机视觉六大技术:图像分类、目标检测、目标跟踪、语义分割、实例分割、影像重建..
计算机视觉是当前最热门的研究之一,是一门多学科交叉的研究,涵盖计算机科学(图形学、算法、理论研究等)、数学(信息检索、机器学习)、工程(机器人、NLP等)、生物学(神经系统科学)和心理学(认知科学)。由于计算机视觉表示对视觉环境及背景的相对理解,很多科学家相信,这一领域的研究将为人工智能行业的发展奠定基础。原创 2022-11-01 16:29:37 · 6523 阅读 · 0 评论 -
研究生如何入门机器学习?
机器学习融合了概率论、线性代数、凸优化、计算机、神经科学等多方面的复杂技术,但是其实真正学的时候,最有用的还是线性代数和高等数学的知识,所以一定要把这两个科目的基础打牢。教授的课程也不错,讲课生动有趣,并且有的内容是可以和Ng相互补充,还有唐宇迪的课也适合小白入门,比较通俗易懂,有时间的话建议一起看。西瓜书的时候,整个人学完一天脑袋都是痛的,公式晦涩难懂,不适合新手学习,不是直接学习西瓜书。通过自己大半年的接触和了解,结合一些大佬们的需求,对于如何入门机器学习提出自己的几点看法。.........原创 2022-08-10 15:55:18 · 873 阅读 · 1 评论 -
一文了解图神经网络()
导读:图神经网络,科技网络热词!!!研究背景传统的深度学习方法被应用在提取欧氏空间数据的特征方面取得了巨大的成功,但许多实际应用场景中的数据是从非欧式空间生成的,传统的深度学习方法在处理非欧式空间数据上的表现却仍难以使人满意。例如,在电子商务中,一个基于图(Graph)的学习系统能够利用用户和产品之间的交互来做出非常准确的推荐,但图的复杂性使得现有的深度学习算法在处理时面临着巨大的挑战。这是因为图是不规则的,每个图都有一个大小可变的无序节点,图中的每个节点都有不同数量的相邻节点,导致一些重要的操作(转载 2022-05-09 18:07:21 · 1199 阅读 · 0 评论 -
卷积神经网络之父Yann LeCun 最新发声:自监督+世界模型,让 AI 像人类与一样学习与推理
如何突破当代人工智能(AI)的瓶颈?不同学者存在不同观点。总体来看可以概括为两类,其一监督学习者,提倡通过改善数据标签质量,从而完善监督学习。代表人物有发起“以数据为中心AI”革命的吴恩达,提倡设计“合成数据自带所有标签”的Rev Lebaredian。其二,无监督学者,例如Yann LeCun,提倡下一代AI系统将不再依赖于精心标注的数据集。近日,Yann LeCun在meta AI(原Facebook)官方博客上以及IEEE采访中,深度阐述了他的自监督学习思路,他认为AI想要突破现在的...转载 2022-02-27 16:16:29 · 750 阅读 · 0 评论 -
人工智能-机器学习学习路线及详细的机器学习入门资源整理
导读:学习是一项复杂的智能活动,学习过程与推理过程是紧密相连的,按照学习中使用推理的多少,机器学习所采用的策略大体上可分为4种——机械学习、通过传授学习、类比学习和通过事例学习。学习中所用的推理越多,系统的能力越强。转载 2022-02-21 15:58:45 · 624 阅读 · 0 评论 -
2022年值得关注的 8 个人工智能趋势及中国人工智能行业发展情况
人工智能是Artificial Intelligence,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。转载 2022-02-12 15:13:29 · 4726 阅读 · 2 评论 -
2022年人工智能领域发展七大趋势(元宇宙/自动驾驶)
一、增强人类的劳动技能二、更大更好的语言建模三、网络安全领域的人工智能四、人工智能与元宇宙五、低代码和无代码人工智能六、增自动驾驶交通工具七、创造性人工智能原创 2022-01-11 16:40:14 · 3923 阅读 · 0 评论 -
一文学会Mask RCNN算法及实战-深度学习物体检测【有代码论文】
算法可以用来做“目标检测”、“目标算法能干什么算法可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。算法有什么优点Mask R-CNN是一个非常灵活的框架,可以增加不同的分支完成不同的任务,可以完成目标分类、目标检测、语义分割、实例分割、人体姿势识别等多种任务,高速、高准确率、简单直观。这理解是一个概念:实例分割。通常意义上的目标分割指的是语义分割,语义分割已经有很长的发展历史,已经取得了很好地进展,目前有很多的学者在做这方面的研究;然而实例分割是一个从目标分割领域独立出来原创 2022-01-10 16:32:29 · 1960 阅读 · 0 评论 -
深度学习与自动驾驶-应用-卷积神经网络
对于自动驾驶这个技术,其实大家或多或少都对其存在抵触心理,但是在大势所趋之下,自动驾驶这个技术还是在不断地蓬勃发展!原创 2021-12-28 19:03:19 · 2291 阅读 · 0 评论 -
百度AI开发者大会-你是其中一个嘛?百度Create大会(无人驾驶)
导读:2017年百度推出科技顶级盛会,也是全球规模最大的AI开发者大会。大会主要面向企业和技术开发者、科技爱好者,旨在探讨国际前沿技术和产业应用,打造中国的AI技术高地。今日,下午两点直播大会,会上通过虚拟世界和现实世界无缝切换的沉浸式交互方式,带来人工智能、自动驾驶等多项前沿领域的技术进展与应用李彦宏:“人机共生”时代 中国迎来AI黄金十年2021年12月27日,百度创始人、董事长兼首席执行官李彦宏在百度AI开发者大会中表示,今天我们的相聚方式既梦幻又现实,这就是当下时代“人机共生”进入生原创 2021-12-27 17:24:30 · 6359 阅读 · 0 评论