论文阅读笔记
文章平均质量分 94
记录日常的阅读,内容主要与医疗相关
tzc_fly
2017-2021:华中科技大学本科,2021-至今:中山大学博士
展开
-
3D图像与表格的结合MICCAI2021
阿尔兹海默症预筛原创 2024-02-28 17:22:29 · 1066 阅读 · 0 评论 -
DoubleEnsemble:基于样本重加权和特征选择的金融数据分析方法
量化研究原创 2024-02-02 20:37:44 · 1055 阅读 · 0 评论 -
多只动物3D姿态估计与行为识别系统
动物姿态估计和行为识别原创 2024-01-29 17:35:29 · 1637 阅读 · 0 评论 -
LLM应用于MPC
LLM辅助MPC自动驾驶原创 2023-12-26 22:28:55 · 87 阅读 · 0 评论 -
Tabular特征选择基准
特征选择原创 2023-11-25 12:10:33 · 665 阅读 · 0 评论 -
scDrug:从scRNA-seq到药物反应预测
基于细胞系和药物反应数据实现药物推荐原创 2023-11-13 13:52:17 · 312 阅读 · 0 评论 -
自动驾驶车辆轨迹跟踪
人工势-pid-mpc自动驾驶原创 2023-11-02 12:36:40 · 313 阅读 · 0 评论 -
原型part学习NeurIPS2019
原型组件学习原创 2023-05-15 15:51:09 · 621 阅读 · 2 评论 -
类别无关的姿态估计ECCV2022
类别无关的姿态估计原创 2023-05-09 18:15:49 · 1109 阅读 · 0 评论 -
带稀缺注释的动物姿态估计CVPR2023
半监督动物姿态估计原创 2023-05-09 14:11:46 · 1113 阅读 · 0 评论 -
通用医学图像分割模型UniverSeg
通用医学图像分割原创 2023-05-05 00:09:45 · 3634 阅读 · 0 评论 -
评价基于GPT和Bert的方法并用于生信文本识别PPI
微调和提示范式用于文本PPI提取原创 2023-04-30 16:02:42 · 1720 阅读 · 2 评论 -
ProteinGAN扩展蛋白质序列空间
蛋白质的3D结构、物理化学性质和分子功能由其氨基酸序列决定。从20种常见的氨基酸中,一个包含100个氨基酸的小尺寸蛋白质可以用1013010^{130}10130种不同的方法制成。在这个巨大的多维空间中,估计只有110771/10^{77}1/1077可以折叠成3D结构来执行特定功能。这给旨在筛选具有增强特性的新序列方法带来了很大的负担,因为随机的氨基酸替换都可能会导致蛋白质活性下降。而另一方面,机器学习可以直接从氨基酸序列推断蛋白质特性和功能。原创 2023-04-25 16:28:31 · 507 阅读 · 0 评论 -
几何感知Transformer用于3D原子系统建模
分子系统能量力场的基本形式可以分解为基于键、键角、扭转角和非键相互作用等因素的函数。为了包含上述因素并进行能量估计,神经网络需要学习原子-原子(键和非键原子对)、原子-键(键角)和键-键(扭角)之间的相互作用。而过去基于Transformer的模型只学习原子-原子之间的相互作用。为了扩展信息并利用Transformer,作者提出Moleformer,它显式模拟原子-原子对之间的相互作用。Moleformer将原子、键和非键原子对作为输入,并应用平移旋转不变几何感知空间编码来捕获这些输入之间的几何关系。原创 2023-04-24 22:16:45 · 494 阅读 · 0 评论 -
CCGNet用于发现共晶材料中的coformer
CCGNet共晶预测原创 2023-04-23 20:54:27 · 853 阅读 · 0 评论 -
用于3D分子生成的等变扩散模型ICML2022
EDM原创 2023-04-08 16:00:51 · 1407 阅读 · 0 评论 -
几何扩散模型用于分子构象生成ICLR2022
GEODIFF原创 2023-04-08 14:40:28 · 873 阅读 · 0 评论 -
用于模拟原子相互作用的continuous-filter卷积NeurIPS2017
量子力和能量预测原创 2023-03-29 22:57:58 · 589 阅读 · 0 评论 -
FCN+:全局感知的卷积
语义分割是密集预测任务,目的是为每个像素分配一个类别。挑战一:同一个对象,超大尺度的和超小尺度的容易被忽略。为了缓解这个问题,多尺度特征表示被用于编码不同尺度的对象。挑战二:不同对象,相似的视觉外观导致边界混淆,为了分割边界,有必要将全局上下文信息集成到每个像素的表示中,以便利用整体场景理解边界。FCN具有鲁棒性,然而其感受野有限,不能得到全局上下文信息。PSPNet采用多个尺度的pooling来引入多尺度上下文,但pooling本身会丢失空间细节信息。原创 2023-03-25 16:28:55 · 879 阅读 · 1 评论 -
将图像作为点集学习ICLR2023
基于聚类的视觉学习原创 2023-03-10 13:10:38 · 580 阅读 · 0 评论 -
graph在细粒度分类中的应用
由于这些特征是灾难性的高维特征,通常难以优化,作者提出了一个新的基于图的语义分组模块,将这些特征嵌入到紧凑空间中。然而,目前大多数的WFGIC方法都是独立挑选出判别区,直接利用其特征,而忽略了区域特征之间的语义相互关联,区域组具有更强的判别能力。为了解决这些问题,作者提出了一个基于图传播的端到端相关性学习模型GCL,以充分挖掘和利用WFGIC的区域相关的判别潜力。细粒度对象识别侧重于将一个基本类别的对象区分为子类,由于不同类别之间存在细微的视觉差异,这在深度学习领域依然是一个挑战。,该特征用于细粒度分类。原创 2023-02-27 14:57:43 · 391 阅读 · 0 评论 -
细粒度视觉分析综述TPAMI2021
视觉细粒度分析综述原创 2023-02-21 01:19:28 · 1804 阅读 · 0 评论 -
ViT自适应patch划分 ACM MM 2021
ViT由三个部分组成,一个patch embedding模块,多头注意力模块,前馈多层感知机MLP。网络从patch embedding模块开始,该模块将输入张量转换为token序列,然后输入多头自注意力模块和MLP以获得最终表示。下面主要阐述patch embedding模块,并回顾多头自注意力模块。patch embedding模块将图像分割成具有固定大小和位置的patch,并用线性层embedding每个patch。假设输入张量为A∈RH×W×CA∈RH×W×C。原创 2023-02-14 11:21:24 · 1411 阅读 · 1 评论 -
3-track网络预测蛋白质结构和相互作用
DeepMind在最近的CASP14上展示了非常准确的预测。作者探索了融合相关思想的网络架构,并通过对一维序列级、二维距离图级(distance map)和三维坐标级(coordinate)的信息依次进行转换和集成的3-track网络获得了最佳性能。该网络产生的结构预测精度接近DeepMind在CASP14中的预测精度,能够快速解决具有挑战性的x射线晶体学和冷冻电子显微镜结构建模问题,并提供对目前未知结构的蛋白质功能的见解。原创 2023-02-13 15:56:35 · 531 阅读 · 0 评论 -
AlphaFold 2 处理蛋白质折叠问题
alphafold2原创 2023-02-13 15:40:10 · 663 阅读 · 0 评论 -
几何等变图神经网络综述
许多科学问题都要求以几何图形(geometric graphs)的形式处理数据。与一般图数据不同,几何图显示平移、旋转和反射的对称性。研究人员利用这种对称性的归纳偏差(inductive bias),开发了几何等变图神经网络(GNN),以更好地描述几何图的几何特性和拓扑。尽管取得了丰硕的成果,但它仍然缺乏一项survey来描述等变GNN是如何发展的,这反过来又阻碍了等变GNNs的进一步发展。为此,基于必要但简明的数学预备知识,我们下面分析并将现有方法分为三组,以了解如何表示GNN中的消息传递和聚合。原创 2022-10-27 16:37:25 · 2158 阅读 · 0 评论 -
分子表示学习与性质预测综述
参考文章:计算机辅助药物设计(CADD,computer-aided drug design)近年来发展迅速。有效的分子表示(molecular representation)和准确的性质预测(property prediction)是CADD工作流程中的关键任务。在这篇综述中,作者总结了当前深度学习(deep learning)方法在分子表示和性质预测方面的应用。作者根据分子数据的格式(1D、2D和3D)对深度学习方法进行了分类。原创 2022-10-15 12:06:24 · 2828 阅读 · 0 评论 -
CLIP:Contrastive Language-Image Pre-Training
虽然后者取得了很好的效果,思路也与CLIP很相似,但是这些工作也还是有局限的,他们这些数据也是经过精心设计的,类别也是从1000到18392个这样的有限类别,并不能真正做到随心所欲zero-shot,并且他们的工作最后都是使用Softmax做一个分类头,所以他们的工作都是固定的,从指定好的类别中选出一个。CLIP是一种基于对比学习的多模态模型,CLIP的训练数据是文本-图像对:一张图像和它对应的文本描述,这里希望通过对比学习,模型能够学习到文本-图像对的匹配关系。个文本-图像对的训练batch,将。原创 2022-10-04 19:29:16 · 1619 阅读 · 0 评论 -
CAM和GradCAM
CAM来自;GradCAM来自;CAM和GradCAM的提出是基于图像分类背景,但是我们应该学会其算法思想,这可以帮我们迁移到后期的其他深度学习研究中。原创 2022-10-03 21:57:32 · 3382 阅读 · 2 评论 -
DynamicHead:基于注意力的统一目标检测头CVPR2021
Dynamic Head是首个突破COCO数据集上单模型表现超越60AP的方法,来自论文:,提出使用多重注意力机制统一物体检测头方法,通过在三个不同的角度(尺度感知、空间位置、多任务)分别运用注意力机制,在不增加计算量的情况下显著提升模型目标检测头的表达能力。这种新的实现方式,提供了一种可插拔特性,并提高多种目标检测框架的性能。原创 2022-09-22 16:27:07 · 2178 阅读 · 1 评论 -
面向开放词汇的目标检测ECCV2022
在目标检测领域,早期的工作利用视觉属性:比如类别的层次结构,类别的相似度,目标对象的局部part,从而将看得见的类别泛化到看不见的类别;为了节省计算,我们考虑离线学习提示向量,具体来说,我们从LVIS获取基本类别的对象crop,相应地调整它们的大小,并通过冻结的CLIP视觉编码器生成图像嵌入。设想第一个发现秃鹰(Bald eagle)的研究者,他可以简单地给这个物种命名Bald eagle,这群秃鹰的特征是相似的:翼展6-7英尺,深褐色或白色的尾巴,白色的头,明亮的黄色眼睛。,因此被称为开放词汇检测器。原创 2022-09-20 20:08:03 · 2047 阅读 · 2 评论 -
可学习的FrameField优化建筑物提取CVPR2021
我们需要两个方向(而不仅仅是一个方向),因为建筑与有机形状(organic shapes)不同,建筑物是具有锐角的规则结构,在这些锐角上捕捉方向需要两个方位(沿着建筑边缘,至少有一个场方向与多边形切线方向对齐。在多边形拐角处,场与两个切线方向对齐,远离多边形边界的区域,框不具有任何对齐约束,但鼓励平滑且不塌陷的场)。)具有不同的单位(数值范围),我们通过使用随机初始化网络在训练数据集的随机子集上平均其值来计算每个损失的归一化系数。,分别对应于栅格化(也是计算机图形学中的光栅化)多边形的内部和边缘。原创 2022-09-13 20:46:26 · 1621 阅读 · 0 评论 -
MaskedAutoencoders视觉学习器CVPR2022
本文表明,掩码自编码器(MAE)是可扩展的计算机视觉自监督学习器。MAE很简单:我们随机屏蔽输入图像的patches,并重建这些缺失的像素。它基于两个核心设计。首先,我们开发了一种非对称编码器-解码器架构,其中编码器仅在可见的patch子集上运行(没有掩码token),以及一个轻量级解码器,该解码器从隐含表示和掩码token重建原始图像。其次,我们发现mask高比例的输入图像(例如75%)会产生重要而有意义的自监督效果。耦合这两种设计使我们能够高效地训练大型模型。我们的可扩展方法允许学习泛化性良好的大型模型原创 2022-07-14 01:37:07 · 682 阅读 · 0 评论 -
利用Scanorama高效整合异质单细胞转录组
整合来自多个实验、实验室和不同技术的 single-cell RNA sequencing(scRNA-seq)数据可以揭示更丰富的生物学问题,但目前的scRNA-seq数据整合方法受到数据集来自功能相似细胞的要求的限制。我们提出了Scanorama算法,该算法可以识别和合并所有数据集对之间的共享细胞类型,并准确地集成scRNA-seq数据的异构集合。我们应用Scanorama整合和消除了来自代表9种不同技术的26个不同scRNA-seq实验的105,476个细胞的批次效应。Scanorama对同一细胞谱系原创 2022-06-23 16:23:38 · 1561 阅读 · 0 评论 -
结合可变形注意力的视觉Transformer
首先要理解Q,K,VQ,K,VQ,K,V:Softmax(QKT)VSoftmax(QK^{T})VSoftmax(QKT)V假设window内的patch总数为3,则有:可以想象,对于3×33\times 33×3注意力分布,即QKTQK^{T}QKT,行代表query,列代表key,QKT[i,j]QK^{T}[i,j]QKT[i,j]为patch iii (query)和patch jjj (key)的相似度。对于SwinT中的相对位置偏置信息:Softmax(QKT+B)VSoftmax(QK^{原创 2022-06-03 15:36:25 · 4278 阅读 · 0 评论 -
PAGA:结合轨迹推断和聚类的工具
目录前置内容背景结果PAGA映射离散断开连接和连续连接的细胞异质性PAGA-initialized学习流形并产生基于拓扑的单细胞embeddingPAGA在与造血(hematopoiesis)相关的数据集中持续预测发育轨迹和基因表达变化PAGA以多种分辨率绘制整个动物(whole animals)的单细胞数据PAGA从RNA velocity中提取信息前置内容为什么要做拟时分析拟时分析并不是真正意义上的时间变化,而是将表达矩阵中不同细胞间连续变化的路径用低维坐标展示(发育路径),根据所得路径,推断发.原创 2022-06-01 13:03:08 · 3544 阅读 · 0 评论 -
场景理解的统一感知分析ECCV2018
目录前置内容-PPM摘要1.Introduction1.1.Related work2.统一感知解析的定义2.1.Datasets2.2.Metrics3.Designing Networks for Unified Perceptual Parsing3.1.实现细节3.2.设计的讨论4.Experiment4.1.Main result4.1.1.Overall architecture4.1.2.Multi-task learning with heterogeneous annotations4..原创 2022-05-27 23:48:42 · 426 阅读 · 0 评论 -
基于SwinTransformer+UNet的遥感图像语义分割
目录摘要1.Introduction摘要全局上下文信息(context information)对于遥感图像的语义分割至关重要。然而,现有的大多数方法都依赖于卷积神经网络(CNN),由于卷积运算的局部性(locality),直接获取全局上下文信息充满了挑战性。受具有强大全局建模能力的Swin transformer的启发,我们提出了一种新的 Remote Sensing image 语义分割框架,称为ST-U网络,该框架将Swin transformer嵌入到基于CNN的经典UNet中。ST UNet.原创 2022-05-26 16:53:56 · 12013 阅读 · 12 评论 -
YOLOX:超越2021年前的YOLO系列
目录摘要1.Introduction2.YOLOX2.1.YOLOX-DarkNet53实验结果摘要在本报告中,我们对YOLO系列进行了一些有经验的改进,形成了一种新的高性能探测器YOLOX。我们将YOLO检测器切换为Anchor Free方式,并采用其他先进的检测技术,即解耦头(decoupled head)和新的标签分配策略SimOTA,以在不同模型比较中实现最先进的结果:对于YOLO-Nano(使用了本文的改进)仅使用0.91M参数和1.08G FLOPs,我们在COCO上获得25.3%的AP,.原创 2022-05-20 22:41:56 · 2105 阅读 · 0 评论 -
SwinTransformer:使用shifted window的层级Transformer(ICCV2021)
目录摘要1.Introduction2.Related Work2.1.CNN and variants2.2.Self-attention based backbone architecture2.3.Self-attention/Transformers to complement CNNs2.4.Transformer based vision backbones3.Method3.1.Overall Architecture3.2.Shifted Window based Self-Attenti.原创 2022-05-17 21:36:56 · 1167 阅读 · 0 评论