传知代码
文章平均质量分 96
分享论文复现的文章
亦世凡华、
个人:csdn内容合伙人、阿里云专家博主、51CTO博主;目标:深耕技术,追求代码之美,享受编程人生;当下:珍惜时间,奋发学习;未来:渴望成为一名真正的全栈大佬,并为此一直努力,矢志不渝!
展开
-
【传知代码】遵循人类指令的高质量图像修复(论文复现)
在计算机视觉领域,图像恢复始终是一个受到广泛关注的议题,这是因为图像可能会因各种因素如噪声、模糊和雨滴等而受到降级处理。降级可以分为局部降级和全局降级两种方式。这些图像降级操作不仅降低了图像质量,还限制了图像在多种应用场景中的实用性。因此,如何对降级进行有效地分类和识别成为一个重要研究方向。尽管传统的图像恢复技术在某些特定的任务中表现得相当出色,但它们在处理多种不同的降级任务时,往往不能实现良好的泛化效果。为了提高退化图像恢复的精度和鲁棒性,需要研究新的算法来实现不同级别降级的有效分离。原创 2024-05-28 14:35:56 · 334 阅读 · 0 评论 -
【传知代码】基于图神经网络的知识追踪方法(论文复现)
论文链接提出了一种基于图神经网络的知识追踪方法,称为基于图的知识追踪(GKT)。将知识结构构建为图,其中节点对应于概念,边对应于它们之间的关系,将知识追踪任务构建为图神经网络中的时间序列节点级分类问题。在两个开放数据集上的实证验证表明,方法可以更好地预测学生的表现,并且该模型比先前的方法具有更可解释的预测,其贡献如下:1)展示了知识追踪可以重新构想为图神经网络的应用。2)为了实现需要输入模型的图结构,在许多情况下并不明确的情况下,我们提出了各种方法,并使用实证验证进行了比较。原创 2024-05-27 13:11:26 · 812 阅读 · 0 评论 -
【传知代码】无监督动画中关节动画的运动表示(论文复现)
动画在教育和娱乐等多个领域得到了广泛的运用,同时也强调了动画在内容创意、故事叙述清晰度和用户体验方面的显著提升。过去,要达到这些动画效果,通常都需要接受过专门培训的技术人员、特定的硬件和软件,以及大量的实际操作。尽管目前仍需专业的知识和持续的努力,但在视觉和图形领域,通过对某些已知的对象类别进行数据驱动方法的培训,我们试图克服其中的某些局限性。近年来,有些工作试图通过运动转移进行无监督,以规避真实数据要求。通过采用图像重建为损失函数,并对运动与外观进行解耦,使训练有明显的进步。原创 2024-05-26 11:09:35 · 293 阅读 · 0 评论 -
【传知代码】掩码自回归编码器法(论文复现)
掩码自动编码器MAE是一款具有可扩展性的计算机视觉自我监控学习器。它可以从一个不完整或错误的图像序列中提取出感兴趣的信息来进行分类和识别,在图像处理领域得到了广泛的应用。MAE的核心策略包括:对输入图像的随机补丁进行屏蔽,并对遗失的像素进行重建,这一策略是基于两个主要的设计思路,如下:1)一种非对称编码器-解码器架构,其中编码器只对可见的补丁子集进行操作(没有掩码标记)2)一个轻量级解码器,它根据潜在表示和掩码标记重建原始图像。原创 2024-05-25 11:00:18 · 762 阅读 · 0 评论 -
【传知代码】基于多模板配准的心腔分割算法(论文复现)
本文复现论文地址提出的心腔分割算法:对于心脏子结构的精确划分、模型构建和深入分析,在临床应用开发中具有至关重要的作用。尽管如此,对所有心脏的子结构进行分割仍然是一个巨大的挑战,并且目前还主要依赖于手工操作。为了克服这个挑战,这篇论文介绍了一种依赖于多模板图像配准技术的自动全心分割方法。这篇论文介绍了一种方法,用于对患者CT图像的中心脏区域的七个子部分进行图像划分。原创 2024-05-24 09:42:43 · 928 阅读 · 0 评论 -
【传知代码】针对股票评论的情感分类器(论文复现)
Transformer模型因其出色的表征学习能力,能够在大量的文本数据上进行预先的训练,并展现出广泛的适用性。因此,Transformer模型在自然语言处理领域得到了广泛的应用,并在各种任务中,包括情感分析,都展现出了卓越的性能。在这篇文章中,我们采用了股票市场上股民的评论数据作为训练数据。投资者的情绪和情感对股票市场有着显著的影响。通过对这些股票评论进行深入的情感分析,分析师和投资者可以更准确地掌握市场参与者的情绪状况,进而更好地预测市场的未来走向;原创 2024-05-23 13:15:52 · 650 阅读 · 6 评论 -
【传知代码】微表情识别系统(论文复现)
面部表情图像预处理是面部表情识别的重要步骤,主要目的是在于提取特征之前排除一切与面部表情无关的干扰因素。例如,环境光照、姿势和不同背景等。在干扰排除后,将人类面部直接与公共参考系相对接、使每个面部特征对应的语义位置精准无误。人脸检测、人脸对齐、数据增强、人脸一是实现面部表情图像预处理的主要方法,其实现的大体逻辑如下:微表情识别系统是一个极具前景和价值的领域,可以帮助我们更好地理解和应对人类情感、健康、安全和商业等方面的问题。原创 2024-05-22 21:40:10 · 955 阅读 · 1 评论 -
【传知代码】图像风格迁移技术(论文复现)
图像风格迁移是指将一张图像的内容与另一张图像的风格相融合,生成具有新风格的图像,风格(style)是指图像中不同空间尺度的纹理、颜色和视觉图案,内容(content)是指图像的高级宏观结构。风格迁移这一想法与纹理生成的想法密切相关,在 2015 年开发出神经风格迁移之前,这一想法就已经在图像处理领域有着悠久的历史。但事实证明,与之前经典的计算机视觉技术实现相比,基于深度学习的风格迁移实现得到的结果是无与伦比的,并且还在计算机视觉的创造性应用中引发了惊人的复兴。原创 2024-05-22 11:20:17 · 571 阅读 · 3 评论 -
【传知代码】多行人姿态检测系统(论文复现)
本系统使用简单,能够自动实时地对老人、儿童、残障人士等实现看护,因而容易在这一目标用户进行推广。当今处于老龄化的社会,老年人数量基数大,同时由于独生子女政策和社会压力的剧增,导致子女很难抽出时间去照顾老人和儿童,而本产品能够在保障被看护人员安全的前提下最大限度地减少看护人员的精力投入,易于被年轻人所接受。养老院、医院数量的增多、交通的日益发达,这些应用场景均可作为本产品的受众对象,能够帮助其解决人员优化调度的问题。原创 2024-05-21 09:29:21 · 1000 阅读 · 6 评论 -
【传知代码】基于扩散模型的无载体图像隐写术(论文复现)
目前,图像隐写技术主要是基于载体图(cover image)的方法,这些方法通常存在泄露隐藏图(secret image)的风险,以及对退化容器图(container image)不鲁棒的风险。受到最近扩散模型(diffusion models)进展的影响,作者揭示了扩散模型所具备的两大特点:一是能够在不进行训练的情况下完成两幅图像间的转换,二是对有噪声的数据具有天生的稳健性。这些建议的特点有助于提高图像隐写任务的安全与稳健性。这是第一次尝试将扩散模型融入到图像隐写的研究中。原创 2024-05-17 20:13:49 · 1061 阅读 · 12 评论 -
【传知代码】情感神经元的意外发现(论文复现)
在2017年4月发布Unsupervised Sentiment Neuron算法的文章《》中指出,“真正的良好预测是和了解联系在一起的”,以及“神经网络在仅用于预测下一个字符的训练后,便自动掌握了情感分析的技巧”。尽管训练出的这个系统初始只是为了能够预测亚马逊评论文本中的下一个字符,而让人惊讶的是,该系统中还出现了意料之外的「情感神经元(sentiment neuron)」,其囊括了几乎所有的情感信号。原创 2024-05-16 20:52:14 · 872 阅读 · 7 评论 -
【传知代码】VRT: 关于视频修复的模型(论文复现)
视频修复技术(Video Restoration Techniques,VRT)是一种利用计算机视觉和图像处理技术来改善、修复和恢复视频内容的方法。其主要目的是消除视频中存在的噪声、模糊、失真、抖动等问题,使视频内容更清晰、更稳定,并且提高其视觉质量和观感。其实现的作用是:1)噪声去除:使用去噪算法来消除视频中的各种类型的噪声,例如高斯噪声、椒盐噪声等,以提高图像质量和清晰度。2)运动补偿:通过分析视频中的运动信息,利用运动估计和补偿技术来减少视频中的运动模糊,使图像更加清晰和稳定。原创 2024-05-15 20:15:49 · 928 阅读 · 8 评论