- 博客(106)
- 资源 (6)
- 收藏
- 关注
原创 图解 | 大模型智能体LLM Agents
本文介绍了LLM代理的存储机制和工具使用方法。在存储方面,LLM具有短期记忆和长期记忆:短期记忆通过上下文窗口或总结对话历史实现;长期记忆则借助向量数据库和检索增强生成(RAG)技术存储历史交互。在工具使用方面,LLM可通过函数调用与外部环境交互,Toolformer等技术能训练模型自主调用API。此外,模型上下文协议(MCP)标准化了API访问流程,简化了工具集成。这些技术共同增强了LLM的记忆能力和功能性。
2025-05-25 23:49:07
916
原创 论文解读|Anthropic提出Contextual Retrieval让RAG再进化,大幅降低检索失败率
2024年9月,Anthropic发布了一种名为Contextual Retrieval的新方案,旨在提升RAG(Retrieval-Augmented Generation)系统的检索准确性。该方案通过结合上下文嵌入(Contextual Embeddings)和上下文BM25(Contextual BM25),将检索失败率降低了49%。传统RAG系统在处理大型知识库时,通常将文档分割成小块进行检索,但这种方式容易丢失上下文信息,导致检索结果不准确。Contextual Retrieval通过在嵌入和BM
2025-05-13 00:40:36
575
原创 数据集 | 苹果目标检测数据集
在农业智能化转型和精准农业发展的背景下,基于计算机视觉的果实自动检测技术扔值得研究。规模适中:包含4430张精心采集的苹果图像,平衡了数据规模与标注质量;场景多样:覆盖不同光照条件(晴天、阴天、逆光)、不同生长期和不同品种的苹果;精细标注:采用统一的标注标准,由农业专家参与审核,确保标注准确性;应用广泛:适用于果实自动计数、成熟度监测、产量预估等多种农业应用场景;该数据集可为以下研究提供支持:● 开发果园自动化监测系统;● 评估不同目标检测算法在农业场景的性能;
2025-04-23 23:04:40
573
原创 数据集 | 柑橘果目标检测数据集
领域痛点与解决方案果实定位准确性不足:传统图像识别方法难以区分树上果实与掉落果实,影响产量估算准确性;数据多样性缺乏:现有数据集往往只包含单一状态(仅树上或仅地上)的柑橘样本;环境适应性差:大多数模型在复杂果园环境(多变光照、遮挡等)下表现不佳。本数据集针对性地解决了这些问题:● 双状态标注:同时标注树上柑橘和树下柑橘,为果实状态识别提供基础。● 真实场景覆盖:包含580张不同光照条件、拍摄角度和成熟度的柑橘图像。
2025-04-22 22:36:50
618
原创 数据集 | 沥青路面缺陷目标检测
当前道路养护领域面临几个显著挑战:1. 数据稀缺性:大多数机构缺乏高质量的标注数据集来训练可靠的缺陷检测模型。2. 类别不平衡:现有数据集往往只关注裂缝等常见缺陷,忽视修补区域和井盖等重要类别。本沥青路面缺陷目标检测数据集提供6,000张精心标注的高质量图像,包含6个关键类别:裂缝、裂缝修补、坑洞、坑洞修补、井盖及其他。
2025-04-12 20:28:35
1009
原创 柑橘病虫害图像分类数据集OrangeFruitDataset-8600
柑橘,作为水果界的 “宠儿”,不仅以其酸甜可口的味道深受大众喜爱,更是在全球水果产业中占据着举足轻重的地位。无论是早餐中的一杯橙汁,还是下午茶里的柑橘甜点,柑橘的身影无处不在,它为无数人带来了味觉上的享受。据统计,全球柑橘的种植面积广泛,产量可观,是许多国家农业经济的重要支柱。我国作为柑橘的主要产地之一,柑橘种植历史悠久,品种丰富,从南到北,众多地区都有柑橘的种植,为当地农民带来了可观的收入。然而,在柑橘产业蓬勃发展的背后,一场无声的 “健康危机” 正悄然降临,那就是柑橘病虫害。
2025-04-09 23:21:21
949
原创 道路裂缝分割检测CrackSegmentationDataset-11200
该数据集包含从12个可用的裂纹分割数据集合并而成的约11200张图像。将每个图像的名称前缀分别是图像原来的数据集。所有图像都被调整为(448,448)的大小。train和test 分别是训练和测试图像,测试图像一共 1695 张,训练图像一共 9603 张;train和test 结构是一样的,都包含了 images 和 masks 文件夹,其中images 包含了 jpg 图片和对于的 JSON 标签文件,masks 包含分割的掩码图像。
2025-04-06 02:00:11
466
原创 道路裂缝数据集CrackForest-156-labelme
在现代城市管理中,道路状况的监测与维护是确保交通安全和城市基础设施健康的重要环节。CrackForest是一个专门为道路裂缝检测和路面状况评估而设计的高质量图像数据库。该数据集包含了156张带注释的道路裂缝图像和标注信息文件,能够为研究人员和开发者提供丰富的数据资源,助力他们在这一领域的研究和应用开发。这些图像不仅捕捉了城市路面的真实状况,还通过专业的注释技术,标记了裂缝的位置和形态。这种数据集非常适合用于训练和验证基于深度学习的道路裂缝检测模型。
2025-04-05 23:04:02
724
原创 道路坑洼目标检测数据集-665-labelme
目标:从道路图像中检测坑洼;应用:检测道路地形和坑洼可实现平稳行驶,小型数据集常常用于学习和学术研究;详细信息: 665 张图、1740个在坑洼处标注的图像数据集,可直接用于坑洼目标检测模型训练。"im_count": 665, # 图片数量"pothole": 1740 # 坑洼标注数据是一逃目标检测数据集。数据采用X-AnyLabeling-CPU-v2.5.0.exe 进行标注。文件包含图像 JPG 文件和标注文件 JSON 格式。],
2025-04-05 14:40:16
433
原创 快递包裹目标检测数据集,labelme格式
这是一套专门针对快递包裹检测的训练数据集。此数据集基于广为人知的COCO数据集进行了扩展,特别添加了大量快递包裹相关的JPEG图像及对应的 labelme 格式标注文件。这些资源对于开发和训练快递行业中的物体识别、自动分拣系统等AI应用至关重要。图片数量 2919 张。标签包括包裹、人、车辆、大车、狗等。● 图像文件:包含各式各样的快递包裹场景,确保模型能够学习到丰富的包裹外观特征。
2025-04-05 02:24:33
534
原创 CCPD车牌检测识别数据集
CCPD (Chinese City Parking Dataset, ECCV)是中国城市车牌数据集,共有两个CCPD2019和CCPD2020 数据集,总数据量约35W左右,可用于车牌检测和识别模型算法开发。CCPD 发表的论文: https://arxiv.org/abs/1709.08828CCPD2020 数据集包含约1万,主要是新能源绿牌数据。CCPD2019数据集主要是蓝牌数据,将近34W 张图片、图片尺寸为720x1160x3,共包含8种类型图片
2024-05-12 15:38:22
4024
1
原创 pip安装包出现错误:ModuleNotFoundError: No module named ‘cmake,ERROR: Failed building wheel for onnx
安装包和依赖是需要编译,错误中提示pyhon环境中cmake运行错误,可能是没有安装cmake。安装cmake之后,重新运行即可。如果有用,请点个三连呗。
2024-03-23 12:38:05
2006
原创 pip无法从清华源下载,ERROR: HTTP error 403 while getting https://pypi.tuna.tsinghua.edu.cn
我的错误是无法从清华源下载opencv包。如果有用,请点个三连呗。更换pip默认源为阿里源。
2024-03-23 12:26:42
6690
1
原创 (一)pulsar介绍
Apache Pulsar 是一个企业级的分布式消息系统,最初由 Yahoo 开发,在 2016 年开源,并于2018年9月毕业成为 Apache 基金会的顶级项目。Pulsar 已经在 Yahoo 的生产环境使用了三年多,主要服务于Mail、Finance、Sports、 Flickr、 the Gemini Ads platform、 Sherpa (Yahoo 的 KV 存储)。Pulsar是一种用于服务器到服务器消息传递的多租户,高性能解决方案。Pulsar最初由雅虎公司开发,由Apache So
2024-03-19 01:07:49
566
原创 计算两张图片的结构相似性指数SSIM
主要考虑了人眼的感知特性,比较两幅图像的亮度、对比度和结构等特征。SSIM 取值范围在 [-1, 1] 之间,越接近 1 表示两幅图像越相似。比较一个文件中哪些图像存在相似的代码示例。
2024-03-17 20:13:09
948
原创 用于吸烟动作目标检测的数据集
用于吸烟动作目标检测的数据集。数据集使用labelme标注。数据集类别分为:吸烟嘴(嘴上吸烟支smoking)、吸烟手(手上拿着烟smoking_hand)。吸烟动作检测part01有1115张图像。
2024-03-17 17:57:56
911
原创 Milvus向量数据库检索
本节介绍如何使用 Milvus 搜索实体。Milvus 中的向量相似度搜索会计算查询向量与具有指定相似度度量的集合中的向量之间的距离,并返回最相似的结果。您可以通过指定过滤标量字段或主键字段的布尔表达式来执行混合搜索。下面的例子展示了如何对2000行的图书ID(主键)、字数(标量场)、图书介绍(向量场)的数据集进行向量相似度搜索,模拟根据搜索条件搜索某本书的情况关于他们的矢量化介绍。Milvus 会根据您定义的查询向量和搜索参数返回最相似的结果。
2024-03-14 22:58:17
2825
原创 Douglas-Peucker压缩算法
是一种用于简化多边形曲线的算法,它通过减少曲线上的点数来逼近原始曲线,同时尽可能地保持其形状。opencv的approxPolyDP就是使用这个算法。
2024-03-13 14:21:49
576
原创 opencv的approxPolyDP函数
cv2.approxPolyDP() 是 OpenCV 库中的一个函数,用于逼近多边形曲线。它可以将一条曲线用更少的点来表示,同时尽可能地保持其形状。原来是使用Douglas-Peucker算法,表示曲线上的点与逼近后的多边形之间的最大距离d,若d小于epsilon,则滤掉,否则保留。函数返回一个逼近后的多边形,表示为 2D 点的列表或 NumPy 数组。
2024-03-13 14:19:23
3692
原创 Milvus的向量索引(内存索引)
Milvus 支持的各种类型的内存索引、每种索引最适合的场景以及用户可以配置以获得更好搜索性能的参数。索引是有效组织数据的过程,它通过显着加速大型数据集上耗时的查询,在使相似性搜索变得有用方面发挥着重要作用。为了提高查询性能,您可以为每个向量字段指定索引类型。注意:目前,向量字段仅支持一种索引类型。 Milvus 在切换索引类型时会自动删除旧索引。
2024-03-11 22:14:38
2891
原创 Milvus的相似度指标
版本: v2.3.x在 Milvus 中,相似度度量用于衡量向量之间的相似度。选择良好的距离度量有助于显着提高分类和聚类性能。下表展示了这些广泛使用的相似性指标如何与各种输入数据形式和 Milvus 索引相匹配。
2024-03-11 21:51:06
2994
原创 机器学习评价指标(分类、目标检测)
通常来讲,逻辑回归的概率越大说明越接近1,也就可以说他是坏用户的可能性更大。比如,我们定义了阈值为0.5,即概率小于0.5的我们都认为是好用户,而大于0.5都认为是坏用户。因此,对于阈值为0.5的情况下,我们可以得到相应的一对查准率和查全率。
2024-03-10 22:57:57
1380
2
原创 makedowm文本居中、首行缩进、回车换行
在使用Markdown的时候(例如CSDN的文字变形),发现一段文字前面无论空多少空格都会被忽略,这就导致无法做到首行缩进。由于Markdown本身不支持字体居中,所以采取HTML语法。之间的文本使用 `` 或者 加粗 等无效。输入两个空格,然后接着按下Enter。使用 \,然后接着按下Enter。如果有用,请点个三连呗。
2024-03-10 15:33:59
2903
原创 python redis连接池实现代码
最近在使用redis时,我的场景是数据读取频繁,短连接方式导致链接的开销,性能变慢。高并发下还频繁出现链接不上的问题等问题。连接池是个解决该问题不错的方法
2024-03-09 13:45:15
1204
原创 指数移动平均(EMA)
在深度学习中,经常会使用EMA(指数移动平均)这个方法对模型的参数做平均,以求提高测试指标并增加模型鲁棒。实际上,EMA可以看作是Temporal Ensembling,在模型学习过程中融合更多的历史状态,从而达到更好的优化效果。指数移动平均(Exponential Moving Average)也叫权重移动平均(Weighted Moving Average),是一种给予近期数据更高权重的平均方法。
2024-03-08 00:39:42
3054
1
原创 YOLOV9论文解读
yolov9提出可编程梯度信息(PGI)和基于梯度路径规划的通用高效层聚合网络(GELAN),最终铸成YOLOv9目标检测全新工作!性能表现SOTA!在各个方面都大大超过了现有的实时目标检测器,优于RT DETR、YOLOv8等网络,代码刚刚开源
2024-03-05 09:23:28
3308
原创 docker配置数据默认存储路径graph已过时,新版本中是data-root
docker配置数据默认存储路径graph已过时,新版本中是data-root
2024-02-28 09:17:07
1364
数据集牛品种CattleBreed,包含90个类别,每个类别50张图片
2023-07-07
牛脸检测小数据集,里边包含700张牛脸图片和对应的标注文件 适合小实验使用
2023-06-23
第4例 代码基于卷积神经网络VGG的猫狗图像识别
2023-06-16
整理了一份《Stable Diffusion Prompt 提示词语法》,包含基础语法、权重语法、分布与交替渲染以及示例
2023-04-26
花图像分类(雏菊、玫瑰、向日葵)小型数据集
2023-03-12
嵌入式系统开发 - ARM Cortex-M3 嵌入式系统 (黄克亚版本)教材课件
2023-03-12
目标检测之口罩检测数据集,2700张图片和相应的VOC格式标注信息
2022-03-20
OpenCV计算机视觉基础教程(Python版慕课版)课件PPT,一共包含10章
2022-03-22
基于LSTM的电影评论感情倾向分析代码,适合初学者研究RNN模型,适合毕业设计参考
2022-03-14
英文翻中文的小数据集,适合做自然语言处理NPL的机器翻译模型验证
2022-03-13
数据集-柑橘果目标检测数据集-labelme,580张目标检测图片,包含树上柑橘On-tree和树下柑橘果Under-tree的标注
2025-04-22
数据集-苹果果目标检测-labelme-4430
2025-04-23
数据集-part1-沥青路面缺陷目标检测数据集-labelme-6000
2025-04-12
数据集-part3-沥青路面缺陷目标检测数据集-labelme
2025-04-12
数据集-part2-沥青路面缺陷目标检测数据集-labelme
2025-04-12
快递包裹目标检测数据集-2919-labelme
2025-04-05
柑橘病虫害图像分类数据集OrangeFruitDataset-part1-2000张,柑橘溃疡病Citrus canker、柑橘黑点病melanose和健康柑橘3类别
2025-04-09
柑橘病虫害图像分类数据集OrangeFruitDataset-part2-2000张,柑橘溃疡病Citrus canker、柑橘黑点病melanose和健康柑橘3类别
2025-04-09
柑橘病虫害图像分类数据集OrangeFruitDataset-part3-2000张,柑橘溃疡病Citrus canker、柑橘黑点病melanose和健康柑橘3类别
2025-04-09
柑橘病虫害图像分类数据集OrangeFruitDataset-part4-2600张,柑橘溃疡病Citrus canker、柑橘黑点病melanose和健康柑橘3类别
2025-04-09
道路裂缝分割检测CrackSegmentationDataset-11200
2025-04-06
CrackForest实例分割检测数据集-118-masks和labelme标签格式,专门为道路裂缝检测和路面状况评估而设计的高质量图像
2025-04-05
17 个类别的花卉数据集,贝母花-、雏菊、番红花、风信子、向日葵、水仙花、野百合、虎皮百合等
2024-03-13
道路坑洼目标检测-665-label,小型数据集常常用于学习和学术研究
2025-04-05
part01吸烟动作目标检测的数据集,labelme标注,类别有:嘴上吸着烟smoking、手拿着烟smoking-hand
2024-03-17
5种花卉分类数据集(百合-Lilly、兰花-Orchid、莲华-Lotus、向日葵-Sunflower、郁金香-Tulip)
2024-03-13
YOLOv9论文,2024.02发布
2024-02-26
大模型综述(中文版)- 研究细节非常详细
2023-08-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人