大模型
文章平均质量分 91
普通网友
这个作者很懒,什么都没留下…
展开
-
Meta强势推出分割一切新工作的视觉大模型!SAM2对比YOLOV8
SAM 2 是 Meta 的Segment Anything Model (SAM) 的后续产品,是一款专为图像和视频中的综合对象分割而设计的尖端工具。它采用统一、可提示的模型架构,支持实时处理和零镜头泛化,在处理复杂的视觉数据方面表现出色。原创 2024-08-26 17:32:12 · 1104 阅读 · 0 评论 -
Nature子刊,上智院、复旦、中国气象局研发次季节AI大模型「伏羲」,突破「可预报性沙漠」
它能够改变气候科学的研究范式,突破传统模式的局限性,实现更精细的空间分辨率和更长时间尺度的精准气候风险预报。目前,「伏羲」次季节气候预测大模型仍有提升空间,例如其空间分辨率为 1.5 度,与 ECMWF 次季节模式的 36 公里的空间分辨率相比仍相对粗糙,目前预报的是日均气温、缺少日最高温度和日最低温度等。「伏羲」次季节气候预测大模型有效提升了对 MJO 的预测技巧,将 MJO 的预测技巧达到了 36 天,大幅超过了 ECMWF 的 S2S 模式的 30 天时长。原创 2024-08-19 15:30:00 · 497 阅读 · 0 评论 -
登Nature子刊|北航、清华团队用AI在多空间组学平台上高分辨率表征组织,比原始分辨率高36倍
通过对 Visium、Xenium、spatial-CUT&Tag、slide-DNA/RNA-seq 等多种空间组学平台的综合评估,soScope 提高了识别具有生物学意义的肠道和肾脏结构的性能,揭示了无法以原始分辨率解决的胚胎心脏结构,并纠正了测序和样本处理中出现的样本和技术偏差。在这里,北航和清华的研究团队引入了空间组学范围(soScope),这是一个完全生成的框架,它模拟来自不同空间组学技术的点级概况的生成过程,旨在提高它们的空间分辨率和数据质量。组织是由具有不同分子状态和空间组织的细胞构成的。原创 2024-08-16 16:11:33 · 817 阅读 · 0 评论 -
在计算机视觉领域,有哪些新兴技术值得关注?扩散模型、自监督学习、弱监督学习、视觉语言模型、NeRF编辑技术
扩散模型可以用于修复受损或有缺陷的图像,通过逐步去除噪声并恢复图像的原始内容。:扩散模型能够将低分辨率图像重建为高分辨率图像,同时保持图像的细节和纹理。:扩散模型可以执行图像翻译任务,即将图像从一个风格转换到另一个风格,或者对图像进行编辑,如内容替换等。:扩散模型可以辅助进行图像分割和目标检测任务,提供更加精准的分割边界和检测框。:扩散模型在无条件图像生成方面展现出了优异的性能,能够生成高质量、多样化的图像。:扩散模型可以根据文本描述生成相应的图像,这在创意设计和虚拟内容生成中非常有用。原创 2024-08-07 11:57:50 · 850 阅读 · 0 评论 -
现在投身于计算机视觉是否明智?新兴技术
投身于计算机视觉领域目前被认为是一个明智的选择。计算机视觉作为人工智能的一个重要分支,其技术的应用范围广泛,包括但不限于工业自动化、医疗影像分析、安全监控、智能交通和游戏开发等领域。随着技术的不断进步,尤其是深度学习技术的突破,计算机视觉在多个视觉任务上已经超越了人类,市场对计算机视觉专业人才的需求持续增长。当前,计算机视觉领域的就业前景非常广阔,市场上针对机器视觉检测的专业和课程相对较少,导致相关领域方面的人才短缺。此外,技术的快速更新和应用领域的扩展也为从业者提供了新的技能要求和发展方向。原创 2024-08-07 11:49:06 · 1123 阅读 · 0 评论 -
哈佛团队开发FairDomain:实现跨域医学图像分割和分类中的公平性
为了弥补现有偏见缓解工作的不足,我们引入了一种新的多功能公平身份注意力(FIA)机制,该机制设计为可以无缝集成到各种域适应和泛化策略中,通过人口统计属性(例如,种族群体)派生的自注意力来协调特征重要性,以促进公平性。本文介绍了 FairDomain,这是一项开创性的系统研究,旨在研究域偏移下的算法公平性,采用最先进的域适应 (DA) 和泛化 (DG) 算法进行医疗分割和分类任务,以了解偏差如何在不同域之间转移。在我们的实验中,我们首先分析了在域转移背景下的公平性,具体关注于杯盘分割任务。原创 2024-08-05 09:24:06 · 590 阅读 · 0 评论 -
2024 年将主导 AI 和机器学习的 6 大趋势
了解 2024 年流行的顶级,您必须了解这些趋势才能在您的取得成功,并了解它们如何有望改变行业。随着 2022 年 11 月 ChatGPT 的推出,人工智能在 2023 年发生了翻天覆地的变化。在过去的一年里,人工智能领域取得了令人振奋的巨大发展,其中包括复杂的多模态模型和蓬勃发展的开源领域。2024 年,人工智能将成为全球企业的游戏规则改变者。然而,随着组织开始更多地关注实时工作而不是实验,即使生成式人工智能继续吸引着科技界,观点也变得越来越成熟。原创 2024-07-24 16:42:08 · 1053 阅读 · 0 评论 -
成为AI工程师的路线图(在2024年成为 AI 工程师的技能、学习资源和项目想法)
在确定 AI 工程师如何成为下一个大型技术角色之后,是时候学习如何成为一名重要角色了。让我们先揭开路线图的面纱!原创 2024-07-24 16:25:26 · 637 阅读 · 0 评论 -
生成式AI进入知识图谱时代?微软开源的GraphRAG爆火,Github Star量破万
这里,这两个答案都是准确的。近日,Neo4j 公司 CTO Philip Rathle 发布了一篇标题为《GraphRAG 宣言:将知识加入到生成式 AI 中》的博客文章,Rathle 用通俗易懂的语言详细介绍了 GraphRAG 的原理、与传统 RAG 的区别、GraphRAG 的优势等。现如今,RAG 是一种使用真实世界信息改进 LLM 输出的技术,是大多数基于 LLM 的工具的重要组成部分,一般而言,RAG 使用向量相似性作为搜索,称之为 Baseline RAG(基准RAG)。原创 2024-07-17 10:03:34 · 1052 阅读 · 0 评论 -
全面解读视觉大模型-视觉Transformer原理、应用、优缺点以及未来发展趋势
视觉大模型,也称为视觉Transformer,是近年来计算机视觉领域的一大突破。这种模型在图像识别、目标检测、语义分割等任务中表现出色,成为深度学习领域的研究热点。本文将通过万字长文,对视觉大模型进行全面解读,包括其原理、应用、优缺点以及未来发展趋势。原创 2024-07-03 13:43:16 · 3602 阅读 · 0 评论 -
顶会宠儿:几何深度学习!将几何先验知识融入深度学习模型!读完这篇,小白也可以了解GDL!
几何深度学习的未来发展潜力巨大。随着深度学习技术的不断进步,结合几何学的深度学习模型有望在更多领域内实现突破。例如,结合无监督学习或半监督学习的几何深度学习模型可能会在不需要大量标注数据的情况下,依然能够实现高性能的学习和预测。几何深度学习以其独特的视角和方法,在机器学习领域内开辟了一条新的研究路径。它不仅丰富了深度学习的理论基础,也为解决实际问题提供了新的思路和方法。随着研究的深入,几何深度学习有望在未来的智能系统中扮演更加重要的角色。原创 2024-06-24 15:02:54 · 775 阅读 · 0 评论 -
中科院版「分割一切」Fast SAM模型 | 精度相当,速度提升50倍!目前GitHub6.9K+星
比Meta的「分割一切模型」(SAM)更快的图像分割工具,来了!中科院团队开源了FastSAM模型,能以50倍的速度达到与原始SAM相近的效果,并实现25FPS的实时推理。该成果在Github已经获得6.9K+次星标,在Twitter、PaperswithCode等平台也受到了广泛关注。原创 2024-04-30 16:47:57 · 2162 阅读 · 0 评论 -
多模态学习:多模态大模型(医疗影像分析)
多模态学习允许机器从多种不同的数据源学习,例如,可以从图像和文本中同时学习,这样可以让模型更好地理解世界。它的核心在于处理和分析多源异构数据,提取深层次的概念、语境和关联性。原创 2024-04-12 11:58:42 · 2281 阅读 · 0 评论 -
打造你的专属大模型,学完即可使用上岗!技术人的大模型课程(人工智能/机器学习/深度学习)
在教学方面,Daniel指导的AI研究课题广泛且深入,包括图像分割、医疗报告生成、三维运动生成、多模态对话生成、视频理解及评论生成等,这些课题跨越计算机视觉、自然语言处理和多模态等多个研究方向。他在顶尖学术会议和期刊上发表了15篇以上的论文,包括但不限于ACM MM、CIKM、AAAI、ICLR和TOSEM等,并担任SOSP、ACL、EMNLP、MSR、ICSE、ICSME等多个会议的程序委员会成员或审稿人。4、社区支持与行业网络:加入我们,你将有机会接触行业大咖,参与热点话题的分享,拓宽你的职业网络。原创 2024-04-08 14:25:36 · 1109 阅读 · 0 评论