自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI公园

专注分享干货的AI公众号,图像处理,NLP,深度学习,机器学习,应有尽有.希望大家能在AI的乐园中快乐玩耍.

  • 博客(784)
  • 资源 (3)
  • 收藏
  • 关注

转载 使用LLMs来生成合成数据

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Kritin Vongthongsri编译:ronghuaiyang导读如果我告诉你,现在有可能在几分钟内生成数千个高质量的测试案例,这些案例你过去可能要花费数周时间精心制作,你会怎么想?Using LLMs for Synthetic Data Generation: The Definitive Guide构建大规模、全面的数据集...

2024-07-24 09:00:22 68

转载 红队对抗LLM:完整的循序渐进的操作指南

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Kritin Vongthongsri编译:ronghuaiyang导读LLM红队测试是一种通过故意的对抗性提示来测试和评估LLM的方法,旨在帮助揭示任何潜在的不期望或有害的模型脆弱性。就在两个月前,Gemini在生成的图像中过于努力地追求政治正确,将所有人脸都表现为有色人种。尽管这可能对一些人(如果不是很多人的话)来说很滑稽,但很明...

2024-07-23 09:01:01 82

转载 视频生成模型Gen-3 Alpha和Dream Machine有API了?

近日AI视频生成工具接连“内卷”,开始”神仙打架“模式。无论是Runway的Gen-3 AIpha还是Luma的Dream Machine都是业内翘楚!既然同样作为视频生成模型,那肯定免不了拿来对比。看下Luma的Dream Machine和RunwayGen-3 Alpha生成的视频对比。(均生成自302.AI的AI视频生成器)prompt:黄昏时分篝火的电影广角镜头。周围是岩石,背景是日落时的...

2024-07-23 09:01:01 95

转载 微调并评估LLaMA 3的终极指南

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Jeffrey Ip编译:ronghuaiyang导读不超过100行代码微调并评估LLM。微调大型语言模型(LLM)相比于依赖如OpenAI的GPT模型等专有基础模型,带来了诸多益处。想一想,你可以获得低至十分之一的推理成本,每秒处理的token数量提高十倍,而且无需担心OpenAI在其API背后可能进行的任何隐晦操作。我们应该这样思...

2024-07-22 09:18:23 122

转载 构建LLM应用:高级RAG(第十部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读现在,请跟随我们一起踏上另一段探索之旅,进入高级RAG技术的迷人世界。欢迎回到我们关于高级检索增强生成(RAG)技术系列的最新篇章!在本系列的前九部分中,我们深入探讨了RAG,解析了检索机制与生成模型之间的精妙互动。从掌握生成模型的基础知识到通过大型语言模型(LLMs)探索前沿技...

2024-07-19 09:00:16 123

转载 构建LLM应用:构建LLM服务(第九部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读LLM Serving指的是部署和运行大型语言模型(LLMs)以处理用户请求的过程。它涉及到将通常离线训练的LLM设置为实时响应查询。LLM Serving指的是部署和运行大型语言模型(LLMs)以处理用户请求的过程。它涉及到将通常离线训练的LLM设置为实时响应查询。以下是LLM...

2024-07-18 09:00:20 161

转载 构建LLM应用:评估(第八部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读我们在上一篇博客中成功构建了多个RAG应用。现在,让我们来看看评估这些应用的过程。我们在上一篇博客中成功构建了多个RAG应用。现在,让我们来看看评估这些应用的过程。我们将探究从我们的大型语言模型生成的结果有多可靠。首先,让我们通过下表来理解传统机器学习、深度学习和LLMs之间的区...

2024-07-17 09:01:15 121

转载 构建LLM应用:开源聊天机器人(第七部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读在这篇博客文章中,我们将使用LangChain创建一个基础的LLM应用程序。介绍我们之前的博客文章深入探讨了大型语言模型(LLMs),覆盖了它们的发展历程和广泛的应用场景。现在,让我们更近距离地聚焦这一旅程的核心:本地构建LLM应用程序。在这篇博客文章中,我们将使用LangCha...

2024-07-16 09:23:32 61

转载 构建LLM应用:大语言模型LLM(第六部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读接下来,我们将转向RAG应用的生成部分。在文本生成方面,我们将运用大型语言模型。到此为止,我们已经了解到原始数据是如何被转化并存入向量数据库的,随后再依据用户的提示从数据库中检索出相关的数据片段。这标志着应用程序检索部分的工作已经完成。接下来,我们将转向RAG应用的生成部分。在文...

2024-07-15 09:02:06 60

转载 构建LLM应用:搜索&检索(第五部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读在系列博客中,我们通过检索增强生成(RAG)应用的视角来学习大规模语言模型(LLM)。让我们开始在RAG应用程序中探索寻找相关数据的旅程。当用户输入查询时,过程包括对用户查询进行分词,并使用与嵌入原始数据相同的模型进行嵌入。接着,根据与用户查询的相似度,从知识库中提取相关的信息块...

2024-07-12 09:02:24 101

转载 构建LLM应用:向量数据库(第四部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读在系列博客中,我们通过检索增强生成(RAG)应用的视角来学习大规模语言模型(LLM)。1. 引言在之前的博文中,我们已经讨论到将原始数据嵌入为向量的内容。为了重复利用嵌入的信息,我们需要存储这些嵌入,以便按需访问。为此,我们使用一种特殊的数据库,即向量数据库。对于使用检索增强生成...

2024-07-11 09:00:20 111

转载 构建LLM应用:句子Transformer(第三部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读通过检索增强生成(RAG)应用的视角来学习大型语言模型(LLM)。在前几篇博文中,我们学习了面向RAG的数据准备,这包括数据摄入、数据预处理及分块。由于在执行RAG期间需要搜索相关的上下文分块,我们必须将数据从文本格式转换为向量嵌入。因此,我们将探索使用Sentence Tran...

2024-07-10 09:00:09 89

转载 构建LLM应用:数据准备(第二部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读在系列博客中,我们通过检索增强生成(RAG)应用的视角来学习大规模语言模型(LLM)。检索增强生成(RAG)的数据准备工作流在上一篇文章中,我们深入探讨了检索增强生成(Retrieval Augmented Generation, RAG)的流程,全面理解了它的各个组成部分。任何...

2024-07-09 09:00:36 62

转载 构建LLM应用:介绍(第一部分)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Vipra Singh编译:ronghuaiyang导读在系列博客中,我们通过检索增强生成(RAG)应用的视角来学习大规模语言模型(LLM)。即使是一个简单的检索增强生成(RAG)应用也涉及到调整众多不同的参数、组件和模型在我最近对语言模型(LLM)应用的探索中,我被检索增强生成(RAG)所扮演的重要角色深深吸引。从概念构想到云上部署...

2024-07-08 09:00:27 45

转载 微调LLMs : 介绍,方法和最佳实践

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Turing编译:ronghuaiyang导读来自Turing的LLMs的Fine-Tuning的最佳实践。大型语言模型(LLMs)凭借其先进的功能和高度精密的解决方案,已经彻底改变了自然语言处理领域。这些模型在海量文本数据集上接受训练,执行诸如文本生成、翻译、摘要和问题回答等多种任务。然而,尽管LLMs功能强大,它们往往与特定任务或...

2024-07-05 09:00:39 49

转载 增强RAG:选择最佳的嵌入和重排模型

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Ravi Theja编译:ronghuaiyang导读对于如何选择最佳的嵌入模型和重排模型,给出了详细的步骤和代码。在构建检索增强生成(RAG)管道时,关键组件之一是检索器。我们有多种嵌入模型可供选择,包括 OpenAI、CohereAI 和开源的sentence transformers。此外,还有来自 CohereAI 和sent...

2024-07-04 09:00:12 176

转载 如何在不损失精度的情况下减少数据集的数据量

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Arty Ariuntuya编译:ronghuaiyang导读以YOLOv8为例,给出了详细的操作步骤。我们常常听说数据是推动强大且稳健模型发展的支柱。这的确是事实——数据是我们输入算法的原始材料,帮助它们学习、适应并做出预测。然而,并非任何数据都能满足要求。在训练计算机视觉模型时,高质量、干净的数据才是真正起决定性作用的因素。“垃圾...

2024-07-03 09:00:34 76

转载 构建LLM的最佳实践

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Nitzan Gado编译:ronghuaiyang导读Intuit 公司分享了他们在为生成式人工智能操作系统构建多个大型语言模型过程中所学到的经验。生成式人工智能已经从一个有趣的研究话题发展成为改变行业的技术。众多公司正竞相将生成式AI功能整合到其产品和工程流程中,但这一过程比看上去要复杂得多。成功整合生成式AI需要有合适的大型语言...

2024-07-02 09:00:30 61 1

转载 马斯克的大语言模型Grok的发布声明

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:xAI编译:ronghuaiyang导读xAI的测试版大语言模型Grok的发布声明。Grok发布声明Grok是一款模仿《银河系漫游指南》的人工智能,其目的是回答几乎任何问题,甚至是提出应该问什么问题的建议!Grok被设计成以一些幽默感来回答问题,并带有一丝叛逆,所以如果你不喜欢幽默,请不要使用它!Grok的一个独特而基本的优势是,它通...

2023-11-07 09:01:40 430

转载 微调TrOCR,训练TrOCR能识别弯曲和模糊文本

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Sovit Rath编译:ronghuaiyang导读本文对TrOCR模型在弯曲和模糊文本数据集上进行了微调,并分析了每一步的代码和训练结果。TrOCR (Transformer based Optical Character Recognition)模型是最好的 OCR 模型之一,在之前的文章中,我们分析了这个模型在单行打印文本和手...

2023-09-17 10:00:04 1262

转载 TrOCR:基于Transformer的OCR介绍和使用

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Sovit Rath编译:ronghuaiyang导读本文介绍了TrOCR的结构和使用方法,手把手从每一行代码教起。光学字符识别(OCR)在过去几年中出现了一些创新。它对零售、医疗、银行和许多其他行业的影响是巨大的。尽管有着悠久的历史和一些最先进的模型,研究人员仍在不断创新。与深度学习的许多其他领域一样,OCR也看到了transfor...

2023-09-15 08:56:33 4703

转载 使用Stable Diffusion图像修复来生成自己的目标检测数据集

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Rédigé par Gabriel Guerin编译:ronghuaiyang导读有些情况下,收集各种场景下的数据很困难,本文给出了一种方法。深度学习模型需要大量的数据才能得到很好的结果,目标检测模型也是一样。要训练一个YOLOv5的模型来自动检测你最喜欢的玩具,你需要拍几千张你的玩具在不同上下文中的照片,对于每张图,你需要标注玩具...

2023-09-05 09:01:00 753

转载 DETR解析第三部分:结构和细节

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Aritra Roy Gosthipaty and Ritwik Raha编译:ronghuaiyang导读本文中,我们会学习DETR的模型结构。。DETR Breakdown Part 3: Architecture and Details在系列1种,我们理解了DETR诞生的原因和方式,关键的特点,以及他和之前的模型的区别。在系列2...

2023-08-16 09:00:59 245

转载 DETR解析第二部分:方法和算法

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Aritra Roy Gosthipaty and Ritwik Raha编译:ronghuaiyang导读在本文中,我们会学习到DETR中应用的方法。这是DETR解析系列的第 2 部分。在之前的文章中,我们了解了哪些因素导致了DETR的诞生,添加了哪些部分,以及到底什么使得DETR 成为当今的超级目标探测器。DETR 的关键组成部分...

2023-08-03 09:00:21 117

转载 DETR解析第一部分:Detection Transformer的介绍

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Aritra Roy Gosthipaty and Ritwik Raha编译:ronghuaiyang导读在本系列中,我们将了解DETR,这是一种使用transformer的端到端可训练的深度学习架构,用于目标检测。DETR的介绍在这篇文章中,我们用 DETR 探索了目标检测的革命(整个架构如下图所示的交互图所示),这是一种采...

2023-07-28 09:01:17 201

转载 目标检测的后处理:NMS vs WBF

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Ching (Chingis)编译:ronghuaiyang导读对目标检测后处理中的NMS和WBF的解释和对比。目前,计算机视觉在许多地方都有重要的应用,例如自动驾驶汽车、监控系统和图像识别。计算机视觉的主要挑战之一是目标检测,它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能,研究人员和从业者开发了各种技术,例如模型集成...

2023-07-26 09:00:37 135

转载 扩散模型的基本内容介绍

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:RyanO'Connor编译:ronghuaiyang导读本文从原理讲起,介绍了扩散模型的很多基础内容。扩散模型的迅速崛起是机器学习在过去几年中最大的发展之一。在这篇文章中,你能了解到关于扩散模型的一切。扩散模型是生成模型,在过去的几年里已经获得了显著的普及。仅在21世纪20年代发表的几篇开创性论文就向世界展示了扩散模型的能力,比如...

2023-04-04 09:00:47 3762

转载 如何解决“RuntimeError: CUDA Out of memory”问题

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Nitin Kishore编译:ronghuaiyang导读一些可以尝试的解决“RuntimeError: CUDA Out of memory”的方案。当遇到这个问题时,你可以尝试一下这些建议,按代码更改的顺序递增:减少“batch_size”降低精度按照错误说的做清除缓存修改模型/训练在这些选项中,如果你使用的是预训练模型,则最容...

2023-03-22 09:00:47 9619 3

转载 YOLO系列的演进,从v1到v7(三)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Maxim Ivanov编译:ronghuaiyang导读在本文的前几部分中,我们回顾了 YOLO 家族的前 9 种架构。在最后一篇文章中,我们将介绍目前 3 种最新架构。YOLOR作者Chien-Yao Wang, I-Hau Yeh, Hong-Yuan Mark Liao (Taiwan).主要论文“You Only Learn...

2023-03-21 09:00:38 439

转载 YOLO系列的演进,从v1到v7(二)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Maxim Ivanov编译:ronghuaiyang导读在上一部分中,我们研究了最古老的三种架构:YOLO,YOLOv2,YOLOv3。今天,我们将处理接下来的六种结构。YOLOv4, Scaled YOLOv4作者Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark LiaoJose...

2023-03-20 09:00:17 878

转载 YOLO系列的演进,从v1到v7

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Maxim Ivanov编译:ronghuaiyang导读经典再回顾,本文介绍v1到v3。如果你需要速度快的目标检测器,那么 YOLO 系列的神经网络模型实际上是当今的标准。解决检测问题还有很多其他优秀的模型,但我们不会在这篇综述中涉及它们。目前,已经写了相当多的文章来分析 YOLO 各个版本的功能。本文的目的是对整个家族进行比较分析...

2023-03-17 09:00:14 345

转载 理解如何处理计算机视觉和深度学习中的图像数据

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Bikram Baruah编译:ronghuaiyang导读包括了适用于传统图像的数据处理和深度学习的数据处理。介绍:在过去几年从事多个计算机视觉和深度学习项目之后,我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时,甚至可能不需要深度学习模型,经过一些处理后一个简单的分类器可...

2023-03-13 09:00:16 378

转载 Debug图像分类模型:为什么模型会在生产环境中失效?

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Emad Ezzeldin编译:ronghuaiyang导读计算机视觉模型在训练、验证和测试集中可以正常工作,但在生产场景中失效。本文讨论模型在生产中失效的一些常见模式。错误模式1:变体分类器(观察到了错误的地方)模型预测了环境等虚假特征,而不...

2023-03-10 09:00:26 117

原创 卷积神经网络长尾数据集识别的技巧包

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读对长尾数据集的tricks进行了分析和探索,并结合一种新的数据增强方法和两阶段的训练策略,取得了非常好的效果。Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural Networks摘要:目前,在长尾分布的数据集上,在数据极端不均衡的...

2022-11-17 10:00:57 1083

转载 纹理分析以及结合深度学习来提升纹理分类效果

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Trapti Kalra编译:ronghuaiyang导读纹理分析的介绍,各种纹理分析方法,并结合深度学习提升纹理分类。人工智能的一个独特应用领域是帮助验证和评估材料和产品的质量。在IBM,我们开发了创新技术,利用本地移动设备,专业的微型传感器...

2022-09-09 08:00:29 1949

原创 Equalized Focal Loss for Dense Long Tailed Object Detection 论文解读

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读对Focal Loss做了改进,使之可以在一阶段物体检测器中适用于长尾分布数据集的场景。效果提升明显。摘要:最近的长尾目标检测的方法,都是用的2阶段的模式。而在实际的工业场景中,一阶段目标检测器是更常用的,应为它更加简单,更容易部署。但是,在长尾分布的场景中,这部分的工作并没有进行很深入的探索。本文,我们研究了是否一阶段的物体检测器也可...

2022-08-30 20:50:38 1595 4

转载 ​计算机视觉传感器&系统

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”因公众号更改了推送规则,记得读完点“在看”~下次AI公园的新文章就能及时出现在您的订阅列表中作者:Mehdi Amine编译:ronghuaiyang导读捕捉和诠释光的旅程。从硬件到实现计算机视觉的系统,本文的概述侧重于广度而非深度。为了平衡这种方法,本文引导读者阅读具有指导性的参考文献,并提供了随时可以运行的源代码。我们从图像形成的机制开...

2022-08-26 19:00:59 586

转载 优化PyTorch的速度和内存效率(2022)

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”作者:Jack Chih-Hsu Lin编译:ronghuaiyang导读你应该知道的18个PyTorch小技巧。调试深度学习的pipelines就像找到最合适的齿轮组合你为什么要读这篇文章?深度学习模型的训练/推理过程涉及很多步骤。在有限的时间和资源条件下,每个迭代的速度越快,整个模型的预测性能就越快。我收集了几...

2022-06-21 10:01:00 1343

原创 M-CenterNet:多中心点的CenterNet

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读本文针对小目标检测,在CenterNet上进行了改进,将CenterNet上的一个中心点改成了4个中心点,取得了不错的效果,改...

2022-03-08 10:00:00 1525 3

原创 TTFNet:改进CenterNet,使得训练时间缩短7倍

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”导读本文是对CenterNet的一种改进,主要是增加了训练时参与回归的样本,提升了收敛速度,加快了训练时间,同时使用了椭圆高斯核来...

2022-03-01 10:00:00 4771

matlab图像处理工具箱pdf,英文版

matlab的官方文档,英文版pdf,带目录,包括各种常用函数的使用,非常好用,可作为学习教材,也可作为技术手册查询。

2015-01-16

freescale,imx6,Vivante.2D.API

freescaler的imx6芯片中GPU2D的api相关文档

2014-08-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除