自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(116)
  • 收藏
  • 关注

原创 ⌈ 传知代码 ⌋ WRN: 宽度残差网络

本文复现论文提出的深度神经网络模型。为了解决深度神经网络梯度消失的问题,深度残差网络(Residual Network[2])被提出。然而,仅为了提高千分之一的准确率,也要将网络的层数翻倍,这使得网络的训练变得非常缓慢。为了解决这些问题,该论文对ResNet基本块的架构进行了改进并提出了一种新颖的架构——宽度残差网络(Wide Residual Network),其减少了深度并增加了残差网络的宽度。

2024-08-18 00:47:10 765

原创 ⌈ 传知代码 ⌋ DETR[端到端目标检测]

在目标检测需要许多手工设计的组件,例如非极大值抑制(NMS),基于人工经验生成的先验框(Anchor)等。DETR这篇文章通过将目标检测作为一个直接的集合预测问题,减少了人工设计组件的知识,简化了目标检测的流程。给定一组固定的可学习的目标查询,DETR推理目标和全局图像的上下文关系,由于DETR没有先验框的约束,因此对于较大的物体预测性能会更好。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!后续还会继续更新💓,欢迎持续关注📌哟~💫如果有错误❌,欢迎指正呀💫。

2024-08-18 00:39:40 567

原创 ⌈ 传知代码 ⌋ 【FCOS】2D目标检测算法

FCOS提出了一个全卷积的单阶段目标检测器,以逐像素预测的方式解决目标检测,类似于语义分割。FCOS通过消除预先定义的锚框集合,完全避免了训练过程中与锚框相关的复杂计算,例如与锚框相关的所有超参数,而这些参数通常对最终的检测性能非常敏感。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!后续还会继续更新💓,欢迎持续关注📌哟~💫如果有错误❌,欢迎指正呀💫【传知科技 – 了解更多新知识】

2024-08-16 18:53:48 431

原创 ⌈ 传知代码 ⌋ 当下最牛的图像压缩算法

首先,这篇文章的出发点就是图像压缩最本源的目的,就是探索如何在相同的码率下获得更高质量的重建图像,或者说在得到的重建图像质量一样的情况下,如何进一步节省码率。然后作者就站在前人做的利用深度学习压缩的基础上思考,有一批人使用CNN的方法,可以很好地降低空间冗余度,然后捕获图像的空域结构;另一批人使用Transformer的结构,来捕捉图像中长距离的空间依赖关系。于是作者就想,能不能把这两种方法做一个结合,做这么样一个结构,使其同时具备这两种算法的优点。于是就在此基础上,作者提出了本文的方法。

2024-08-16 18:48:44 577

原创 ⌈ 传知代码 ⌋ Visual SLAM函数

SLAM代表同步定位和地图构建(Simultaneous Localization and Mapping),这一技术的主要含义在于其能让一个计算机通过外界定位传感器所传回的信息,经过算法函数的整合与过滤后可以得出该计算机所对应的代理机器处在的探测环境中的准确位置。在这其中,Visual SLAM便是一个只用环境图像便能实现精准定位的一个SLAM函数,并且还能是吸纳动态构造并实时更新周遭环境地图,让机器人可以在构建出的3D地图里定位和规划路径。

2024-08-15 18:59:22 599

原创 ⌈ 传知代码 ⌋ 文生语音之ChatTTS的使用

ChaTTS是一个功能强大的文本转语音系统,该模型使用了大量的的文本和语音数据进行相关模型的训练。目前该模型已经开源了训练之后的模型权重文件,以供程序员使用。本文将从TTS(Text-To-Speech)模型的角度讲解文生语音模型的原理,并以ChatTTS为例阐述部署模型和参数微调。VITS由于采用对抗训练的模式,模型主要包括生成器和判别器两大块,判别器仅在训练时使用。具体实现上,生成器net_g由SynthesizerTrn实现,包括先验编码器、随机时长预测器、解码器和后验编码器;

2024-08-15 18:53:22 678

原创 ⌈ 传知代码 ⌋ 如何穿透模糊,还原图片真实面貌

算法框图上图Transformer模块的核心模块是:( a )多Dconv头转置注意力( Multi-Dconv Head Transpose Attention,MDTA ),它执行跨通道而不是空间维度的查询关键特征交互;( b )门控Dconv前馈网络( Gated-Dconv Feeding Network,GDFN ),它执行受控的特征变换,即允许有用信息进一步传播。多Dconv头转置注意力(Multi-Dconv Head Transpose Attention,MDTA)

2024-08-13 18:30:38 578

原创 ⌈ 传知代码 ⌋ 基于ROS的气体浓度建图

本案例基于ROS系统和数字传感器,并采用VSLAM技术实现了在Rviz下的气体浓度可视化建图,不同的气体浓度通过不同的颜色进行表示。其中的定位技术并不局限于VSLAM技术,只要是能通过ROS发布定位话题的相关定位技术均可以实现气体浓度建图,如UWB、GPS等。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!后续还会继续更新💓,欢迎持续关注📌哟~💫如果有错误❌,欢迎指正呀💫【传知科技 – 了解更多新知识】

2024-08-13 18:22:09 1016

原创 ⌈ 传知代码 ⌋ 平行宇宙中的某某某

本项目复现了CVPR2024中的一篇题为的文章。该文章旨在实现从单一的面部照片,生成在多样化头部位置、姿势、表情和光照条件等不同场景下的个性化图像。整个pipeline是基于预训练好的stable diffusion,在此基础上添加了一个新的框架—CapHuman,用于实现:个性化 (Generalizable Identity Preservation): 编码个体的身份特征,并将其对齐到latent space, 用以保持身份的一致性。

2024-08-12 18:38:46 674

原创 ⌈ 传知代码 ⌋ 如何把大模型调教成派大星?

背景介绍:预训练语言模型(如BERT、RoBERTa等)在NLU任务上表现出色,但传统的微调方法需要更新模型的所有参数,这在训练时消耗大量内存,并且在推理时需要为每个任务保留模型参数的副本。提示调整(Prompt Tuning):与传统的微调相比,提示调整通过只调整连续的提示(prompts),而不是整个模型参数,来减少每个任务的存储和内存使用。但以往的研究表明,对于非大型预训练模型,提示调整的性能并不理想。P-Tuning v2方法。

2024-08-12 18:28:17 682

原创 ⌈ 传知代码 ⌋ 神经网络图像隐写

图像隐写术是一种在图片中隐藏消息的过程。虽然密码学等其他技术旨在防止对手阅读秘密消息,但隐写术旨在隐藏消息本身的存在。在本文中,我们提出了一种新的技术,用于使用生成对抗网络在图像中隐藏任意二进制数据,这使我们能够优化我们的模型生成的图像的感知质量。我们表明,我们的方法实现了每像素 4.4 位的最新有效载荷,逃避隐写分析工具的检测,并且对来自多个数据集的图像有效。为了实现公平比较,我们发布了一个在线可用的开源库封面图像 C 是从所有自然图像 PC 的概率分布中采样的。

2024-08-10 18:34:26 592

原创 ⌈ 传知代码 ⌋ 主动学习实现领域自适应语义分割

本文讲解并复现一篇CVPR论文 “Towards Fewer Annotations: Active Learning via Region Impurity and Prediction Uncertainty for Domain Adaptive Semantic Segmentation”,该论文基于主动学习实现像素级分割–语义分割,并实现迁移学习–将两个虚拟生成的数据集进行训练,并迁移到真实世界数据集综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!

2024-08-10 18:28:11 841

原创 ⌈ 传知代码 ⌋ 基于深度学习的高效时序预测

2022年,清华大学软件学院的学者提出了Autoformer:用于长期时间序列预测的自相关分解Transformer延长预测时间是实际应用的关键需求,如极端天气预警和长期能耗规划。本文研究了时间序列的长期预测问题。先前的基于 Transformer 的模型采用各种自注意力机制来发现长期依赖关系。然而,长期未来复杂的时间模式禁止模型找到可靠的依赖关系。本文通过对Transformer进行改进,通过序列分解和全新的自相关机制对时序数据进行建模,在各种公开的数据集上达到了很好的效果综上,我们基本了解了。

2024-08-09 18:47:48 659

原创 ⌈ 传知代码 ⌋ 增大图像分辨率,让图像更清晰

超分辨率(Super-Resolution),简称超分(SR)。是指利用光学及其相关光学知识,根据已知图像信息恢复图像细节和其他数据信息的过程,简单来说就是增大图像的分辨率,从模糊的低分辨率图像中重建出清晰度高、细节饱满的高分辨率图像。分辨率是描述图像清晰度的一个重要参数,它通常通过两个维度来定义:水平分辨率和垂直分辨率。这两个维度的乘积(即像素总数)决定了图像的总体分辨率。例如,一个800x600像素的图像,其分辨率就是800乘以600,即480,000像素。

2024-08-09 18:41:39 758

原创 ⌈ 传知代码 ⌋ CNN实现脑电信号的情感识别

情绪(或情感)识别(或检测)正日益引起来自多学科背景研究者的关注。情感计算,作为Picart提出的一个新兴研究领域,旨在使计算机系统能够准确地处理、识别和理解人类表达的情感信息,从而实现自然的人机交互(HCI),这是情感计算中的前沿科学问题。作为一种复杂的心理状态,反映在生理行为和生理活动中。过去十年里,研究人员一直致力于通过收集各种生理行为和生理活动中的情感信息来识别情感,例如来自麦克风的声音信号、神经生理活动测量设备的数据、摄像头的视频以及网站的文本等。

2024-08-08 18:47:39 897

原创 ⌈ 传知代码 ⌋ 强化学习和MCTS实践

大家一定惊叹于AlphaGo zero在围棋领域的巨大成功,这种成功来源于强化学习的发展,在这里将以五子棋为例,向大家介绍如何从零开始手搓一个带有计算能力的AI人工智能。基本的算法与AlphaGo zero差不多,主要是自我博弈强化学习以及蒙特卡洛搜索树(MCTS)。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!后续还会继续更新💓,欢迎持续关注📌哟~💫如果有错误❌,欢迎指正呀💫【传知科技 – 了解更多新知识】

2024-08-08 18:38:47 737

原创 ⌈ 传知代码 ⌋ LAD-GNN标签注意蒸馏

在当今的数据科学领域,Graph Neural Networks (GNNs) 已成为处理图结构数据的强大工具。然而,传统的GNN在图分类任务中面临一个重要挑战——嵌入不对齐问题。本文将介绍一篇名为“Label Attentive Distillation for GNN-Based Graph Classification”的论文,该论文提出了一种新颖的解决方案——LAD-GNN,以显著提升图分类的性能。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!

2024-08-07 18:34:59 868

原创 ⌈ 传知代码 ⌋ 生成对抗网络GAN详解与实现

生成对抗网络(Generative Adversarial Networks, GAN)是一种深度学习模型,由Ian Goodfellow等人在2014年提出。GAN的核心思想是通过两个神经网络的对抗训练来生成逼真的数据。它包含两个主要部分:生成器(Generator)和判别器(Discriminator)。该模型在扩散模型被广泛应用之前一直是图像生成领域非常重要的一个模型,现如今即使再扩散模型强大的冲击下,该模型在如妆容迁移等领域依然有着非常广泛的应用。本文将详细介绍该模型并在MNIST数据集上进行实现。

2024-08-07 18:27:03 820

原创 ⌈ 传知代码 ⌋ 5分钟速成半监督医学图像分割

这里我将介绍一篇MICCAI 2023的一篇医学图像分割的文章。这篇文章提出了一种新的解耦一致性半监督医学图像分割框架。该框架充分利用预测数据,将预测数据解耦为用于各种功能的数据,并最大限度地发挥每种功能的优势。如该图所示,DC-Net包含一个编码器和两个一致的解码器,对于A解码器,用双线性插值进行上采样,对于B解码器使用反卷积进行上采样。

2024-08-06 18:45:55 624

原创 ⌈ 传知代码 ⌋ 改进表情识别

表情识别在计算机视觉和人机交互中具有广泛的应用前景。基于深度学习的表情识别系统可以帮助识别和分析人脸上的情绪状态,应用于智能安防、情感计算和社交机器人等领域。本文将介绍我们基于改进的MobileNetV3模型进行表情识别的工作。通过引入CBAM注意力机制和GELU激活函数,我们有效地提升了模型的性能和准确度。数据展示及介绍RAF-DB(Real-world Affective Faces Database)是一个广泛应用于表情识别研究的数据集。

2024-08-06 18:39:14 612

原创 ⌈ 传知代码 ⌋ MSA+抑郁症模型总结(三)

CMU-MOSI: CMU-MOSI数据集是MSA研究中流行的基准数据集。该数据集是YouTube独白的集合,演讲者在其中表达他们对电影等主题的看法。MOSI共有93个视频,跨越89个远距离扬声器,包含2198个主观话语视频片段。这些话语被手动注释为[-3,3]之间的连续意见评分,其中-3/+3表示强烈的消极/积极情绪。CMU-MOSEI: CMU-MOSEI数据集是对MOSI的改进,具有更多的话语数量,样本,扬声器和主题的更大多样性。

2024-08-05 18:35:15 999

原创 ⌈ 传知代码 ⌋ MSA+抑郁症模型总结(二)

CMU-MOSI: 它是一个多模态数据集,包括文本、视觉和声学模态。它来自Youtube上的93个电影评论视频。这些视频被剪辑成2199个片段。每个片段都标注了[-3,3]范围内的情感强度。该数据集分为三个部分,训练集(1,284段)、验证集(229段)和测试集(686段)。CMU-MOSEI: 它类似于CMU-MOSI,但规模更大。它包含了来自在线视频网站的23,453个注释视频片段,涵盖了250个不同的主题和1000个不同的演讲者。

2024-08-05 18:27:00 985

原创 ⌈ 传知代码 ⌋ MSA+抑郁症模型总结(一)

CMU-MOSI: 它是一个多模态数据集,包括文本、视觉和声学模态。它来自Youtube上的93个电影评论视频。这些视频被剪辑成2199个片段。每个片段都标注了[-3,3]范围内的情感强度。该数据集分为三个部分,训练集(1,284段)、验证集(229段)和测试集(686段)。CMU-MOSEI: 它类似于CMU-MOSI,但规模更大。它包含了来自在线视频网站的23,453个注释视频片段,涵盖了250个不同的主题和1000个不同的演讲者。

2024-08-05 18:19:25 793

原创 ⌈ 传知代码 ⌋ 基于矩阵乘积态的生成模型

生成模型,通过从数据中学习联合概率分布并据此生成样本,是机器学习和人工智能中的一个重要任务。受量子物理学中概率解释的启发,该文章提出了一种使用矩阵积状态的生成模型,这是一种最初用于描述(特别是一维)纠缠量子态的张量网络。其模型享有类似于密度矩阵重正化群方法的高效学习能力,该方法允许动态调整张量的维度,并提供了一种高效的直接采样方法用于生成任务。本文试图复现该文章的工作,利用该文章的思想,方法去实现MNIST手写数字的生成任务。综上,我们基本了解了“一项全新的技术啦”🍭~~

2024-08-01 18:43:32 711

原创 ⌈ 传知代码 ⌋ 使用稀疏查询进行3D目标检测

SparseBEV是一个基于查询的单阶段检测器,具有L个解码器层。SparseBEV首先使用图像主干和FPN结构逐帧处理输入的多摄像机视频。之后,在BEV空间中初始化一组稀疏支柱查询,并通过自适应自注意力进行聚合。这些查询通过自适应时空采样和自适应混合与图像特征交互,以进行3D目标检测。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!后续还会继续更新💓,欢迎持续关注📌哟~💫如果有错误❌,欢迎指正呀💫【传知科技 – 了解更多新知识】

2024-07-31 18:25:06 666

原创 ⌈ 传知代码 ⌋ 基于多模板配准的心腔分割算法

本文复现论文 Automatic Whole Heart Segmentation in CT Images Based on Multi-atlas Image Registration[1] 提出的心腔分割算法。整个心脏子结构的准确分割、建模和分析对于临床应用的开发非常重要。然而,对全部心脏子结构的分割十分具有挑战性,且目前仍然依赖手动操作。为了解决这一难题,该论文提出了一种基于多模板图像配准的自动全心分割算法。论文所提出的方法对患者CT图像中心脏部分的七个子结构进行图像分割。

2024-07-31 18:08:14 819

原创 ⌈ 传知代码 ⌋ 利用scrapy框架练习爬虫

运用Python语言编程知识及实现网络数据采集的各种Python第三方库、Scrapy框架等实现技术爬取网页信息,要求爬取的网页信息至少包括两种类型:标题列表页(该页要包括分页功能)和详情页。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!后续还会继续更新💓,欢迎持续关注📌哟~💫如果有错误❌,欢迎指正呀💫【传知科技 – 了解更多新知识】

2024-07-30 18:34:09 641

原创 ⌈ 传知代码 ⌋ 记忆注意力用于多模态情感计算!

近年来,社交媒体的快速扩张推动了用户生成内容的大幅增加,特别是视频。跨不同模态的自动情感分析已成为旨在增强人机交互的关键研究领域。情感分析最初专注于提取和分析通过文本传达的情感。然而,随着计算能力的提高和视听通信的兴起,多模态情感分析(MSA)已经出现。这种方法集成了文本,音频和视觉输入,以加深对人类情感的理解。MSA在教育、客户反馈分析、心理健康监测和个性化广告等多个领域都有应用,显著增强了我们在各种沟通形式中解释和应对情感线索的能力。

2024-07-29 18:34:55 897

原创 ⌈ 传知代码 ⌋ 红外小目标检测

红外图像在许多领域中都有所应用。例如军事领域中,经常需要通过红外成像设备对远距离的目标进行侦察和监视,如复杂背景下的无人机、导弹之类的物体。此外,航空航天领域中也需要通过红外传感器检测地面或海上的船只、车辆等等。这些需要检测的物体在红外图像中通常都是以不超过7X7像素大小的小目标呈现。在实际应用时,我们一般不需要区分这些物体的形状或纹理,而只需区分图像中是否有这些物体(有时对其检测位置及大小也有一定要求)以及时采取相应的措施,这就是红外小目标检测的应用场景。

2024-07-28 18:12:37 917

原创 ⌈ 传知代码 ⌋ 深度学习革新音乐转录

自动音乐转录(AMT)作为音乐信息检索(MIR)的一个重要分支,其目标是将音频信号转换成可读的乐谱形式,这在音乐分析、教育、制作等多个领域都有着广泛的应用。AMT的发展历程可以划分为两个主要阶段:早期基于规则的方法和现代基于深度学习的技术。在早期阶段,研究者依赖于手工设计的特征提取方法,例如尺度不变特征变换(SIFT)和加速稳健特征(SURF)算法。这些方法虽然在特定应用上取得了成功,但它们的普适性和可扩展性受限,通常需要专业知识来定制特征提取器。

2024-07-27 19:30:36 1012

原创 ⌈ 传知代码 ⌋ 【BLIP】VLP任务的新框架

视觉语言预训练(VLP)提高了许多视觉语言任务的性能。然而,大多数现有的预训练任务只擅长基于理解的任务或者基于生成的任务。此外,同时使用Web收集的有噪声的图像-文本对来扩展数据集虽然在很大程度上提高了性能,但这是一个次优的监督来源。BLIP是一个新的VLP框架,它可以灵活的转移到视觉语言理解和生成任务。BLIP通过引导字幕有效地利用了有噪声的网络数据,其中字幕生成器生成合成字幕,滤波器去除有噪声的字幕。模型结构。

2024-06-19 00:43:22 650

原创 ⌈ 传知代码 ⌋ 一种通用的图像分割模型

图像分割研究像素分组问题,对像素进行分组的不同语义产生了不同类型的分割任务,例如全景分割、实例分割或语义分割。虽然这些任务中只有语义不同,但目前的研究侧重于为每个任务设计专门的架构。Mask2Former是一个能够处理图像多种分割任务(全景分割、实例分割、语义分割)的新框架。它的关键组件是掩码注意力机制,通过约束预测掩码区域内的交叉注意来提取局部特征。Mask2Former将研究工作减少了至少三倍,且在四个流行的数据集上大大优于最好的专业架构。模型结构。

2024-06-19 00:27:34 904

原创 ⌈ 传知代码 ⌋ LLaMA 开放高效基础语言模型

论文跳转这篇文章介绍了一个名为LLaMA的新型基础语言模型系列,这些模型由Meta AI开发,包含从7亿到65亿参数不等的多个版本。LLaMA模型完全使用公开可用的数据集进行训练,不依赖于私有或难以获取的数据集。研究表明,通过在更多的数据上训练,而不是仅仅增加模型大小,可以在给定的计算预算下实现更好的性能。特别是,LLaMA-13B在多数基准测试中超过了GPT-3(175B参数),而65B参数版本的LLaMA与Chinchilla-70B和PaLM-540B等顶尖模型具有竞争力。

2024-06-18 00:39:46 1069

原创 ⌈ 传知代码 ⌋ 2 行代码搞定火灾检测

火灾是一种具有严重破坏性的灾害,给人类的生命财产安全带来了巨大威胁。随着人工智能技术的不断发展,利用深度学习算法进行火灾检测成为了可能。本文提出了基于YOLOv7的火灾检测系统设计与实现。该系统利用YOLOv7深度学习模型,能够实时监测火灾并准确地进行定位。首先,介绍了YOLOv7模型的基本原理和结构,以及在火灾检测中的应用方式。其次,详细描述了火灾检测系统的设计思路和实现过程,包括数据集的准备、模型训练、推理过程等。

2024-06-16 00:53:01 902

原创 ⌈ 传知代码 ⌋【算法】实体关系抽取

实体关系抽取是自然语言处理领域的一个常见任务,它常常和实体识别任务伴生,他们都属于图谱三元组的提取任务。实体识别任务提取出实体,实体关系抽取任务则是负责判断两个实体之间的关系。在句子"Albert Einstein was born in Ulm"中,实体识别任务会识别出"Albert Einstein"和"Ulm"两个实体,而实体关系抽取任务则会判断这两个实体之间的关系是“出生地”(place of birth)。综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!

2024-06-16 00:44:48 659

原创 文心智体 - 健身达人 | 一秒创建属于你的 “贾维斯“

智能体智能体(AI Agent)是一个自主运行的计算实体,旨在通过感知环境、处理信息并采取行动来满足用户需求或完成任务。智能体对用户的主要帮助包括提高效率、个性化服务、决策支持等方面简单来说:智能体是其中一种或多种方式的融合应用提高效率:智能体可以自动执行重复性任务,如日程管理和电子邮件分类,从而释放用户的时间个性化服务:通过学习用户的行为和喜好,智能体能够提供定制化的建议和服务,比如本文当中提及的“健身达人”智能体。

2024-06-16 00:32:59 1075

原创 ⌈ 传知代码 ⌋ MonoCon解读与复现

本文介绍了一种名为MonoCon的方法,用于单目深度目标检测任务中的辅助学习。该方法利用了训练数据中丰富的投影2D监督信号作为辅助任务,在训练过程中同时学习了目标3D边界框和辅助上下文信息。实验结果表明,该方法在KITTI基准测试中取得了优异的表现,并且具有较快的推理速度。文章优点该论文提出了一种简单而有效的方法来进行单目3D目标检测,不需要利用任何额外的信息。作者提出的MonoCon方法学习了辅助单目上下文,这些上下文是从训练中的3D边界框投影而来。

2024-06-12 22:58:56 658

原创 ⌈ 传知代码 ⌋ ERA-CoT: 实体关系推理

该论文提出了一种新的框架,称为基于链式思维的实体关系分析(ERA-CoT),旨在解决涉及多个实体的复杂场景中的推理任务。通过提取文本中的所有实体及其显式关系,并基于这些关系和隐藏信息推断隐式关系,ERA-CoT显著提高了大语言模型(LLMs)的推理能力和问题回答的准确性。实验结果表明,ERA-CoT在各种基准测试中均优于现有的链式思维提示方法,在GPT-3.5上平均提升了5.1%的准确率​​。本篇在论文代码的基础上增加了llama2模型的相关文件,修改了模型相关代码。综上,我们基本了解了。

2024-06-12 22:47:46 888

原创 ⌈ 传知代码 ⌋ Flan-T5 使用指南

本篇《Flan-T5 使用指南》在 Scaling Instruction-Finetuned Language Models 这篇论文的基础上,将展示如何加载和运行 Flan-T5 模型并提供不同任务的运行示例和结果展示,帮助学习者更好地理解和应用 Flan-T5 模型。Flan-T5 是一种基于 T5 架构的预训练语言模型。

2024-06-10 22:18:56 878

原创 ⌈ 传知代码 ⌋ 记忆大师

使用 js 实现卡片记忆配对小游戏,包括css3动效,自适应布局等一共有10对卡片需要配对,点击顺序前后两个一致则配对成功,否则卡片翻转复原一进入页面就开始计时,快来挑战三十秒吧综上,我们基本了解了“一项全新的技术啦”🍭~~恭喜你的内功又双叒叕得到了提高!!!后续还会继续更新💓,欢迎持续关注📌哟~💫如果有错误❌,欢迎指正呀💫【传知科技 – 了解更多新知识】

2024-06-10 22:06:14 354

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除