自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(552)
  • 资源 (1)
  • 收藏
  • 关注

原创 Coursera吴恩达《深度学习》课程总结(全)

01 神经网络和深度学习(Neural Networks and Deep Learning)1-1 深度学习概论主要介绍:主要对深度学习进行了简要概述。首先,我们使用房价预测的例子来建立最简单的单个神经元组成的神经网络模型。然后,我们将例子复杂化,建立标准的神经网络模型结构。接着,我们从监督式学习入手,介绍了不同的神经网络类型,包括Standard NN,CNN和RNN。不同的神经网络模型适合处理不同类型的问题。对数据集本身来说,分为结构化数据和非结构化数据。近些年来,深度学习对非结构化数据的处理

2021-09-24 19:01:44 27941 3

原创 极市平台 | 面部表情识别相关开源数据集汇总2

本文汇总了面部表情识别相关的数据集资源,均附有下载链接。

2024-08-23 17:55:52 481

原创 计算机视觉研究院 | 2024新技术:远距离的小目标也可以准确检测

目前的OD算法对于长距离的小物体的成功率有限。为了提高这项任务的准确性和效率,我们提出了一套新的算法,将图像划分为块,选择具有不同尺度对象的块,详细说明小对象的细节,并尽早检测到它。我们的方法建立在transformer的网络上,并集成了扩散模型以提高检测精度。如在BDD100K,我们的算法将小目标的mAP从1.03提高到8.93,并将计算中的数据量减少了77%以上。

2024-08-23 17:52:50 477

原创 OpenCV与AI深度学习 | 使用OpenCV图像修复技术去除眩光

眩光是一种因过度和不受控制的亮度而引起的视觉感觉。眩光可能会使人丧失能力或只是让人感到不舒服。眩光是一种主观感受,对眩光的敏感度可能有很大差异。老年人通常对眩光更敏感,这是由于眼睛的老化特性。

2024-08-22 17:36:35 869

原创 python | rq,一个无敌的 关于Redis 的Python 库!

RQ 库是一个功能强大且易于使用的后台任务处理工具,能够帮助开发者在各种应用场景中高效地管理和执行异步任务。通过支持简单易用的 API、高效的任务队列、强大的任务调度和监控功能,RQ 提供了强大的功能和灵活的扩展能力。本文详细介绍了 RQ 库的安装方法、主要特性、基本和高级功能,以及实际应用场景。希望本文能帮助大家全面掌握 RQ 库的使用,并在实际项目中发挥其优势。

2024-08-22 17:35:08 384

原创 小白学视觉 | 基于OpenCV的气体泵扫描仪数字识别系统

我们编写了一个简单的Python应用程序以拍摄汽油泵的图像,然后尝试从中读取数字。OpenCV是用于计算机视觉应用程序的流行的跨平台库。它包括各种图像处理实用程序以及某些机器学习功能。除此之外我们希望可以先使用Python对其进行原型设计,然后将处理代码转换为C ++以在iOS应用程序上运行。

2024-08-21 17:45:37 1098

原创 深度学习与NLP | 非Transformer时代到来!全新无注意力模式超越Llama传奇

Mamba架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。

2024-08-21 17:38:14 431

原创 OpenCV学堂 | 汇总 | 深度学习图像去模糊技术与模型

图像模糊通常是由于图像在采集或传输过程中发生的振动、抖动、光线不足或运动模糊等原因导致的。图像去模糊的目标是通过恢复原始图像的清晰细节和轮廓,使图像更加清晰可见。在图像去模糊方面取得了显著成效。图像去模糊技术分类如下:深度自编码器对抗生成网络级联网络多尺度网络重模糊网络。

2024-08-20 14:04:27 1063

原创 新智元 | 百万在线,大圣归来!《黑神话:悟空》石破天惊,RTX 4090D飞越花果山

等待四年,《黑神话:悟空》终于上线。激动的心,颤抖的手,全球玩家们都在电脑屏幕前集结,见证这一中国游戏史上里程碑的一刻。打破多项纪录后,中国游戏版图,会被它撼动吗?就在刚刚,《黑神话:悟空》一上线,就创造了中国游戏史上的奇迹!睽违四年,这一刻,苦苦等待们的玩家们沸腾了。《黑神话:悟空》,将是第一款跻身世界一流水平的国产单机游戏,也注定会是中国游戏史上的一座里程碑。还没上线,游戏就已经打破了多项纪录。

2024-08-20 13:59:34 1187

原创 新智元 | 微调Flux席卷全网,外国小哥一人组一队漫威英雄!

席卷开源界的AI生图王者诞生了!发布半个月,Flux已经成为替代Midjourney的宠儿。各路开发者们开始用自己的照片微调LoRA,一人拿捏多种风格。Midjourney之后,从未见人们对某个AI生图应用,如此疯狂着迷。Flux的横空出世,意味着AI图像生成迈入了一个全新的阶段。马斯克本人表示,真假已经傻傻分不清。

2024-08-19 21:01:31 1061

原创 周报 | 24.8.12-24.8.18文章汇总

为了更好地整理文章和发表接下来的文章,以后每周都汇总一份周报。好的文章值得反复学习!

2024-08-19 20:13:10 859

原创 OpenMMLab | 不是吧?这么好用的开源标注工具,竟然还有人不知道…

在人工智能和机器学习领域,高质量的数据标注是模型训练的关键。正是基于这一需求,我们为您推荐LabelU,一个强大且易用的多模态数据标注工具,涵盖图像、视频、音频等多种类型的数据。LabelU不仅提供了丰富、灵活的标注功能,还支持多种格式的数据导出,可本地部署及二次开发“魔改”,让您的AI项目如虎添翼。

2024-08-18 17:26:25 709

原创 集智书童 | SAM2 在图像分割中是否优于 SAM ?

任何部位分割模型(SAM)在自然图像的零样本提示可分割性方面表现出色。最近发布的任何部位分割模型2(SAM 2)声称在图像方面的性能优于SAM,同时将模型的能力扩展到视频分割。在一个零样本提示可分割性的医疗图像中评估最近模型的能力非常重要。在本研究中,作者对来自不同成像模式的多个数据集进行了广泛研究,以比较SAM和SAM 2之间的性能。

2024-08-18 17:09:20 627

原创 程序员学长 | 最强总结! 深度学习中常见的权重初始化方法

今天给大家分享常见的 7 种权重初始化方法。初始化深度学习模型的权重是影响模型训练速度、稳定性以及最终性能的重要因素。以下是常见的 7 种权重初始化方法,每种方法都有其适用的场景和特性。

2024-08-17 21:31:40 778

原创 python | tinydb,一个非常厉害的 关于数据库的 Python 库!

在现代应用开发中,使用数据库来存储和管理数据是非常常见的需求。对于简单的数据存储需求,关系型数据库可能显得过于复杂。TinyDB 是一个纯 Python 实现的轻量级 NoSQL 数据库,专为嵌入式场景设计,适用于小型项目、原型开发和教学等场景。本文将详细介绍 TinyDB 库,包括其安装方法、主要特性、基本和高级功能,以及实际应用场景,帮助全面了解并掌握该库的使用。

2024-08-17 21:29:39 375

原创 极市平台 | 如何通俗理解扩散模型?

还有谁没有看过diffusion的工作,席卷AI圈的diffusion到底是什么?本文作者用尽量通俗的描述向大家解释 diffusion 的来龙去脉。实验室最近人人都在做扩散,从连续到离散,从 CV 到 NLP,基本上都被 diffusion 洗了一遍。但是观察发现,里面的数学基础并不是模型应用的必须。其实大部分的研究者都不需要理解扩散模型的数学本质,更需要的是对扩散模型的原理的经验化理解,从而应用到 research 里面去。笔者做 VAE 和 diffussion 也有一段时间了,就在这里通俗地解释

2024-08-16 20:47:37 921

原创 OpenCV与AI深度学习 | 使用OpenCV轮廓检测提取图像前景

前景提取是计算机视觉领域中非常流行的任务。使用前景提取方法,我们尝试提取任何我们感兴趣的图像或对象,并丢弃其余的背景。最近基于深度学习的图像分割技术使这变得非常容易。但我们也可以使用纯计算机视觉技术来实现这一点。

2024-08-16 20:20:08 915

原创 GiantPandaCV | 大模型训练:Megatron-Kwai中的内存优化

除了通信优化,对于大模型训练来说,内存优化也是非常重要的问题。在这篇文章里,我们会结合快手发表在今年ATC上的工作(Megatron-Kwai[1]),简单介绍一下内存优化技术。

2024-08-15 21:47:45 659

原创 我爱计算机视觉 | ACL 2024 | 剑桥大学团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。目前训练数据、预训练权重、微调代码等均已开源。该模型已在企业级RAG应用成功落地。作者团队将在8月10日-17日参加ACL 2024,欢迎学术交流和商业合作。

2024-08-15 21:44:44 1042

原创 江大白 | AI算法工程化落地,CUDA开发心得汇总

CUDA编程在AI工程化过程中,是非常重要的一部分。本文详细汇总了作者对于CUDA开发过程中的一些心得和经验,希望对大家有帮助。

2024-08-14 21:52:42 991

原创 Coggle数据科学 | 行业落地分享:大模型 RAG 汽车应用实践

在当今快速发展的人工智能领域,对话式人工智能(AI)正经历着一场由大模型技术引领的转型。这种转型标志着对话式AI从传统的预设规则模式,逐渐转变为更加智能和灵活的生成模式。大模型对话机器人的优势基于大模型的对话机器人通过先进的自然语言处理能力,实现了客户意图的精准预测和实时画像分析。这种技术的应用使得AI能够代替传统的人工预设规则,提供更智能、更高效的客户服务体验。与传统的对话机器人相比,大模型对话机器人能够实时生成策略,整合垂类知识和外部搜索结果,以及利用通用知识库,从而提供更加丰富和准确的信息。

2024-08-14 21:48:10 1049

原创 程序员学长 | 快速学习一个算法,集成学习

今天给大家分享一个强大的算法模型,集成学习是一种提升模型性能和鲁棒性的重要方法,它通过组合多个学习器(通常称为基学习器)来解决同一个问题。它的核心思想是,即通过整合多个模型的预测结果,可以抵消单个模型的偏差和方差,从而提升整体的预测准确性和泛化能力。集成学习在各种复杂任务中,如分类、回归、异常检测等,显示出了强大的效果。集成学习主要分为以下几种类型。

2024-08-13 20:02:07 859

原创 极市平台 | 异常检测开源数据集汇总

本文收集和整理了一些相关的开源数据集,希望能给大家的学习带来帮助。

2024-08-13 19:57:42 457

原创 OpenCV与AI深度学习 | 实战 | 使用YoloV8实例分割识别猪的姿态(含数据集)

在本文中,我将介绍如何使用YoloV8在猪的自定义数据集上进行实例分割,以识别和跟踪它们的不同姿态。

2024-08-12 21:12:34 1166

原创 周报 | 24.8.5-24.8.11文章汇总

为了更好地整理文章和发表接下来的文章,以后每周都汇总一份周报。好的文章值得反复学习!

2024-08-12 21:09:11 995

原创 集智书童 | CNN 与 Transformer 的强强联合:AResNet-ViT在图像分析中的优势 !

作者针对残差CNN分支的注意力引导设计进行了消融实验。同时,作者还分别对CNN分支和Transformer分支进行了架构消融实验,以及将两个分支结合使用的实验。此外,作者将提出的AResNet-ViT网络与经典分类模型的性能进行了比较,并对比了过去三年内发表的三篇论文的结果。

2024-08-11 19:51:13 1024

原创 小白学视觉 | 基于OpenCV的路面质量检测

本期我们将展示一种对路面类型和质量进行分类的方法及其步骤。为了测试这种方法,我们使用了我们制作的RTK数据集。

2024-08-11 17:23:07 854

原创 OpenMMLab | 面向多样应用需求,书生·浦语2.5开源超轻量、高性能多种参数版本

在 2024 年 7 月 4 日的WAIC科学前沿主论坛上,上海人工智能实验室推出了书生·浦语系列模型的全新版本——InternLM2.5。相较于上一代,InternLM2.5 全面增强了在复杂场景下的推理能力,支持 1M 超长上下文,能自主进行互联网搜索并从上百个网页中完成信息整合。

2024-08-10 22:16:28 1122

原创 江大白 | TensorRT模型部署,灵活性和性能调试,技巧梳理解析!

模型的转换是大家在调试模型过程中经常需要做的工作,是不是觉得这个过程很辛苦呢?那有没有兼顾灵活性和性能的更好的方式呢,本文为大家详细介绍了两种更好的方式,希望对大家有所帮助。

2024-08-10 22:13:16 967

原创 python | salmon,一个有趣的 处理电子邮件 Python 库!

电子邮件是现代通信的基础,在许多应用程序中,自动发送电子邮件是一个常见需求。salmon-mail是一个基于 Python 的轻量级邮件发送库,它提供了简洁且强大的 API,用于处理电子邮件的发送和管理。本文将详细介绍salmon-mail库,包括其安装方法、主要特性、基本和高级功能,以及实际应用场景,帮助全面了解并掌握该库的使用。

2024-08-09 22:30:54 768

原创 程序员学长 | 超强!六大优化算法全总结

今天我们将详细讨论一下用于训练神经网络(深度学习模型)时使用的一些常见优化技术(优化器)。

2024-08-09 22:29:31 800

原创 python | python-docx,一个超厉害的 Python 库!

python-docx库是一个功能强大且易于使用的工具,能够帮助开发者在各种应用场景中高效地操作和生成 Word 文档。通过支持创建和修改文档、多种格式、图像和表格操作、段落和标题设置等功能,python-docx提供了强大的功能和灵活的扩展能力。本文详细介绍了python-docx库的安装方法、主要特性、基本和高级功能,以及实际应用场景。希望本文能帮助大家全面掌握python-docx库的使用,并在实际项目中发挥其优势。无论是在自动化报告生成、批量文档处理还是动态合同生成中,python-do

2024-08-08 18:52:51 939

原创 OpenCV与AI深度学习 | 实战 | 基于OpenCV和K-Means聚类实现颜色分割(步骤 + 代码)

为此,我们将首先使用cv2.cvtColor()函数将图像转换为灰度,然后使用cv2.threshold()它将其转换为二进制图像,其中像素为 0 或 255。然后,使用来自的函数将原始图像与蒙版组合,bitwise_and得到cv2一个只有具有相同标签的气泡可见的图像。我们将使用“泡泡射击”游戏中的图像作为示例,根据轮廓查找和过滤气泡对象,并应用 K 均值算法将颜色相似的气泡分组在一起。然后,我们将使用该cv2.mean()函数使用原始图像和气泡的蒙版计算气泡的平均蓝色、绿色和红色 (BGR) 通道值。

2024-08-08 18:50:35 1149

原创 OpenCV与AI深度学习 | SAM2(Segment Anything Model 2)新一代分割一切大模型介绍与使用(步骤 + 代码)

Segment Anything Model 2(SAM 2)是由Meta公司发布的一个先进的图像和视频分割模型。它是Segment Anything Model(SAM)的升级版本,SAM是Meta的FAIR实验室发布的一款用于图像分割的基础模型,能够在给定提示的情况下生成高质量的对象掩模。

2024-08-07 17:41:05 1361

原创 集智书童 | 浙江大学 & 蚂蚁集团提出 PAI,一种无需训练减少 LVLM 幻觉的方法 !

现有的大型视觉-语言模型(LVLM)主要通过将视觉编码器的图像特征与大型语言模型(LLM)对齐,以利用它们卓越的文本生成能力。然而,视觉编码器与语言模型之间的规模差异可能导致LLM在多模态理解中占据主导地位。这种LVLM中的不平衡可能导致产生幻觉的实例。具体来说,LVLM可能在没有视觉输入的情况下生成一致的描述,这表明某些输出仅受上下文文本的影响。

2024-08-07 17:39:12 1026

原创 阿里云开发者 | 如何速成RAG+Agent框架大模型应用搭建

目前大模型的原子能力和API、SDK的更新非常的频繁,也越来越完善,通过一次或者两次的动手搭建,可以让我们知道如何利用这些能力,像“积木”一样,结合自己本身业务或者功能的逻辑,搭建一个完整的大模型“城堡”。

2024-08-06 17:59:23 984

原创 python | xlwings,一个非常实用的 Excel 相关的 Python 库!

xlwings库是一个功能强大且易于使用的工具,能够帮助开发者在各种应用场景中与 Excel 进行高效的交互。通过支持简单易用、灵活强大、跨平台支持、与 Pandas 集成和自动化,xlwings提供了强大的功能和灵活的扩展能力。本文详细介绍了xlwings库的安装方法、主要特性、基本和高级功能,以及实际应用场景。希望本文能帮助大家全面掌握xlwings库的使用,并在实际项目中发挥其优势。无论是在财务数据处理、数据可视化还是报表生成中,xlwings库都将是一个得力的工具。

2024-08-06 17:57:03 681

原创 OpenCV与AI深度学习 | 手把手教你用Python和OpenCV搭建一个半自动标注工具(详细步骤 + 源码)

样本标注是深度学习项目中最关键的部分,甚至在模型学习效果上起决定性作用。但是,标注工作往往非常繁琐且耗时。一种解决方案是使用自动图像标注工具,它可以大大减少标注的时间。

2024-08-05 20:27:31 1041

原创 周报 | 24.7.29-24.8.4文章汇总

为了更好地整理文章和发表接下来的文章,以后每周都汇总一份周报。好的文章值得反复学习!

2024-08-05 20:02:55 817

原创 OpenCV与AI深度学习 | 基于GAN的零缺陷样本产品表面缺陷检测

缺陷检测是工业生产过程中的关键环节,其检测结果的好坏直接影响着产品的质量。而在现实场景中,但产品瑕疵率非常低,甚至是没有,缺陷样本的不充足使得需要深度学习缺陷检测模型准确率不高。如何在缺陷样本少的情况下实现高精度的检测呢?目前有两种方法,一种是小样本学习,另一种是用GAN。本文将介绍一种GAN用于无缺陷样本产品表面缺陷检测。

2024-08-04 17:33:52 876

全国省-市-区城市经纬度汇总.csv

简介:全国主要区县城市经纬度汇总。我国省级行政区划分:23个省、5个自治区、4个直辖市、2个特别行政区,合计34个省级行政区。 省:河北省、山西省、辽宁省、吉林省、黑龙江省、江苏省、浙江省、安徽省、福建省、江西省、山东省、河南省、湖北省、湖南省、广东省、海南省、四川省、贵州省、云南省、陕西省、甘肃省、青海省、台湾省。 自治区:内蒙古自治区,广西壮族自治区,宁夏回族自治区,新疆维吾尔自治区,西藏自治区。 直辖市:北京市,天津市,上海市,重庆市。 特别行政区:香港特别行政区,澳门特别行政区。

2020-09-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除