Ashleyyyi-CSDN博客

原创论文阅读：Mixture-of-Agents Enhances Large Language Model Capabilities

（2）语言模型协作性的发现：即 LLM 之间的遗传协作性，其中模型在可以访问其他模型的输出时往往会产生更高质量的响应，即使这些输出的质量较低。另外开发了一个名为 MoA w/ GPT-4o 的变体，它通过使用 GPT-4o 作为最终 MoA 层中的聚合器，以优先考虑高质量输出。

2024-11-18 16:46:16 792

原创 Kotaemon本地部署流程

kotaemon是一个基于RAG的开源框架，用于与文档进行对话，用于与你的文档聊天，它支持实现Hybrid RAG和Graph RAG这里我采用的离线安装方式。

2024-11-18 16:28:41 1915

原创常用数据网站

AIA各个波段以及HMI的jpg格式图像--2010.4-至今。青岛观象台的手绘黑子 1925-2016。HMI的多种分辨率jpg和movie。HMI一小时为间隔的fit。

2024-09-04 10:03:47 406

原创论文阅读：Deep Learning–based Solar Flare Forecasting Model. III. Extracting Precursors from EUV Images

本文研究了使用活动区域的极紫外（EUV）图像（94、131、171、193、211和335 Å）对太阳耀斑预报的影响。生成了一个数据集，由 2010 年至 2016 年太阳动力学天文台/大气成像组件观测到的活动区域的 EUV 图像组成。基于该数据集，采用深度学习方法从EUV多波长图像中提取前兆。对预测模型的检验结果进行了讨论和分析，得出了以下结论。（1）利用EUV多波长图像进行耀斑预报，各波长均取得较好的效果。在单波长结果中，94 Å波长的结果最好。（2）在组合的多波长结果中，6个波长的融合结果均最佳。

2024-07-13 10:06:19 520 1

原创论文阅读：Making Large Language Models Perform Better in Knowledge Graph Completion

大语言模型具有强大的文本理解与生成能力。是未来大语言模型未来的重要发展方向之一。一方面，大模型凭借其丰富的文本理解和生成能力可以完成知识图谱的构建以及推理和补全，另一方面，知识图谱也可以为大模型提供可信的外部知识。这篇论文着眼于基于大模型的知识图谱补全(LLM4KGC)。讨论了如何将有用的KG结构信息融入到LLMs中，以实现LLMs中的结构感知推理。进一步提出知识前缀适配器( KoPA )来实现这一目标。KoPA通过知识前缀适配器将结构嵌入转化为文本嵌入空间，并获得若干虚拟知识标记。

2024-04-18 11:10:06 740 1

原创论文阅读：Domain Specialization as the Key to Make Large Language Models Disruptive: A Comprehensive Surv

在理解大语言模型之前，首先需要了解的概念是预训练语言模型（PLM），它们能够以无监督的方式从大规模数据中学习通用的语言表示，这可以用于许多下游的NLP任务，同时避免从头开始训练新的模型。在过去的几年中，随着大型语料库和硬件容量的快速增长，模型和训练数据的缩放可以不断提高其容量，这自然衍生出了大型语言模型( Large Language Models，LLMs ) ，如GPT - 3 ，PaLM和LLaMA。

2024-04-16 16:22:47 1278 3

原创论文阅读:Dataset for solarflare prediction using helioseismic and magnetic imager vector magnetic field

本文提出了一个可用于耀斑事件分析的数据集。该数据集源自磁属性和太阳耀斑数据记录。为了创建这个数据集，作者使用了 SunPy 库，该库提供了访问联合科学运营中心（JSOC）和空间天气预报中心（SWPC）数据的途径。通过整合这两个来源的数据，获得了 8,874 个样本，时间跨度为 2010 年 5 月至 2019 年 12 月。收集到的数据以 CSV 数据集的形式存储。

2024-02-28 15:42:02 1057 1

原创 CUDA12.3安装pytorch2.1.0

因为是最新版所以官网还没有出对应的版本，故尝试上一版。验证torch能否正常使用以及版本。torch进行简单的计算。

2024-01-31 13:51:58 3090 2

原创从零开始配置深度学习环境--Windows11+miniconda3+cuda12.3+cudnn8.9.7

CUDA为开发者们提供利用GPU并行计算的API，加速框架的训练速度足够快，是目前最好的选择。为了节省空间，习惯安装miniconda，功能上没有什么差别，但是胜在小而轻，只包含了Python和Conda，但并没有预装其他的库。精简安装会安装CUDA相关组件，同时也会将显卡驱动重新安装，如果不想重新安装显卡驱动，可以选择自定义安装。还是刚刚的include路径，cudnn版本在cudnn_version.h中查看。下载local版本会更方便，这里我下的最新版本12.3。这样就完成了cudnn的安装。

2024-01-31 12:58:45 1363

原创数据集创建相关论文

4亿对图像URL和相应的元数据4亿对CLIP图像嵌入和相应的文本在数据集中实现快速搜索的几组kNN索引img2dataset库，可以从URL列表中高效地爬取和处理数以亿计的图像及其元数据LAION - 400M图像-文本搜索的Web演示以CNVid - 3.5 M数据集中的视频-文本对为例。样本中呈现了三种类型的文本信息：1 )主题(人工编写)，2 )标题(用户上传)，3 ) ASR文本。

2024-01-23 18:36:20 2073

原创论文阅读：WeatherBench: A Benchmark Data Set for Data-Driven Weather Forecasting

数据驱动的方法能否用于预测全球的天气模式，最初的研究由于缺乏共同的数据集和评估指标，使得研究之间的相互比较变得困难。本文给出了一个数据驱动的中期天气预报基准数据集(具体为3 - 5天)。本文提供了源自ERA5的经过处理的数据，简单而明确的评价指标，这将使不同方法之间能够直接比较。此外还提供了简单线性回归技术、深度学习模型以及纯物理预测模型的基线分数。该数据集在https://github.com/pangeo-data/WeatherBench，配套代码具有可重复性，并附有入门教程。

2023-11-20 20:00:57 514 1

原创论文阅读：Comparison of Line-of-Sight Magnetograms Taken by the SDO/HMI and SOHO/MDI

HMI是全日面4096 × 4096像素。空间分辨率为1′′，像元尺寸为0.5′′。谱线为光球中形成的FeI 6173，滤波轮廓的宽度为76 mA。该仪器有两个CCD摄像机：“正面摄像机"和"侧面摄像机”。前置相机在左旋圆偏振( LCP )和右旋圆偏振( RCP )两种偏振状态下采集跨越谱线的6个波长的滤波图，图像之间间隔3.75秒。获取一组完整的12个滤波图需要45。导出多普勒图和视线磁图。侧面相机专门用于测量矢量磁场。当前帧列表需要135秒来获得6个波长位置的6个偏振态的滤波图。

2023-11-07 13:55:24 273

原创论文阅读：Flare Transformer: Solar Flare Prediction using Magnetograms and Sunspot Physical Features

本文提出了Flare Transformer，一种通过磁图模块( MM )和太阳黑子特征模块( SFM ) 同时处理图像和物理特征的太阳耀斑预测模型。引入Transformer注意力机制对输入特征之间的时序关系进行建模。还引入了一个新的可微损失函数来平衡Gandin–Murphy–Gerrity和Brier skill这两个主要指标。在公开的数据集上验证了模型。本文预测未来24 h内发生的最大太阳耀斑等级。输入是HMI全日面视向磁图的时间序列和从活动中提取的区域级物理特征。输出为预测的太阳耀斑等级。

2023-08-28 10:50:39 194

原创论文阅读：Is Space-Time Attention All You Need for Video Understanding?

我们提出了一种无卷积的视频分类方法，该方法完全基于空间和时间上的自注意力。通过直接从一系列帧级别的补丁中学习时空特征，使标准的Transformer架构适用于视频。我们的实验研究比较了不同的自注意力机制，并提出"分割注意力"，即在每个块内分别使用时间注意力和空间注意力。

2023-08-21 10:47:05 174

原创论文阅读：Convolutional Two-Stream Network Fusion for Video Action Recognition

卷积神经网络(卷积神经网络)在视频人体行为识别中的应用为融合外观和运动信息提出了不同的解决方案。为了充分利用时空信息，本文研究了ConvNet在空间和时间上的多种融合方式。当空间和时间网络在卷积层进行融合而非在softmax层进行融合时，不会损失性能，但可以大幅节省参数；在最后一个卷积层进行空间融合效果更好，另外，在预测层之前进行融合可以提高准确率；这种在时空邻域上融合抽象卷积特征的方法进一步提升了性能。基于这些研究，提出了一种新的用于视频片段时空融合的ConvNet架构。

2023-08-20 15:49:32 223

原创论文阅读7.26-7.31

使用了一个13层的CNN分类网络，将Hα太阳图像映射到包含特定特征的图像的概率向量。主要分为五类：filaments, prominences, flare ribbons, sunspots and the quiet Sun。并且使用了迁移学习的方式，从降质的分辨率≈0.3300atλ=6563˚A的SOT图像到分辨率≈1.200atλ=6563˚A)的(SDO/AIA)的图像，网络性能不变。

2023-07-26 15:32:09 129

原创论文阅读：太阳高分辨观测图像与全日面像的高精度配准方法

由于对观测物理量（例如波段，分辨率等）的不同需求，太阳物理观测分为全日面观测和高分辨观测。然而对于局部高分辨像，由于观测设备的指向误差、视场旋转以及焦距的变化，使得直接依赖仪器参数确定的太阳视场坐标不精确，因此需要借助太阳图像上相似的太阳结构 ( 如光球层对应光球层，色球层对应色球层) 与全日面像进行视场匹配。然而全日面观测有大于 31' 的视场，但最高的空间像元分辨率仅为 0. 5″。

2023-07-21 14:18:50 284

原创论文阅读：Applications of AI in Astronomy人工智能在天文中的应用

某些GPR实现通过对核函数的函数形式做出具体的决策，已经实现了良好的性能，例如，它只使用指数项，并进行相应的优化，但这不是一个全局解决方案。在宇宙学中，红移，反映了宇宙尺度的增加，因为光是由一些遥远的物体发出的，由于宇宙膨胀是针对距离，因此在确定遥远的星系和类星体的物理参数时是必要的，如它们的亮度、质量等。时域的开放使对各种现象的系统的、大规模的研究成为可能，包括恒星和活动星系核的变化、各种宇宙爆炸（例如，许多类型的超新星、引力波事件等），正在移动的物体，如有潜在危险的小行星等。未知的待检测目标存在难度。

2023-07-14 15:15:45 959

原创耀斑预测综述：Research Progress on Solar Flare Forecast Methods Based on Data-driven Models

Park等人（2020）推断，成功预测耀斑爆发时间的关键是关注耀斑的平静和活跃阶段之间的过渡时期，他们提出了一种结合预测因子的方法来评估预测的准确性。由于太阳黑子的分类信息和磁场的演化模式与耀斑爆发有很强的相关性，因此将它们作为首选的预测因子。基于太阳黑子的直接观测量包括太阳黑子的数量、太阳黑子群的数量、太阳黑子群的面积、太阳表面的纵向延伸值以及太阳黑子的形态特征。虽然基于这两个因素的太阳耀斑预报取得了巨大的成就，但有必要提出新的前兆因素来反映太阳耀斑爆发的物理机制，以进一步提高预测精度。

2023-06-20 10:08:15 1178

原创 [SCI][计算机视觉][图像处理]一二三四区期刊（自用）

自用期刊目录

2022-12-07 17:40:40 5536 1

原创论文阅读：HMER via Attention Aggregation based Bi-directional Mutual Learning

一、简介本文提出了一个新的具有注意聚集和双向相互学习(ABM)的HMER框架，如图所示。模型包括三个模块：特征提取、注意聚合和双向促进学习。（1）在特征提取模块（FEM）中，使用DenseNet作为特征提取器，因为它在WAP中被证明是有效的，从数学表达式图像中提取特征信息。（2）在注意聚合模块（AAM）中，提出了多尺度覆盖注意，对齐历史注意信息，在解码阶段有效地聚合不同大小的尺度特征，来识别数学表达式中不同大小的字符，从而提高了当前的识别精度，缓解了误差积累的问题。（3）在双向...

2022-04-11 17:39:24 3154

原创论文阅读：Anchor DETR: Query Design for Transformer-Based Detector

一、简介基于Transfomer的检测器中，对象的query是一组可学习的嵌入。然而，每个学习到的query都没有明确的物理意义，我们也不能解释它将关注在哪里。很难进行优化。在本文中，作者提出了一种基于Transformer的检测器——Anchor DETR。Anchor DETR中有基于anchor point（锚点）的查询设计，因此每个查询只预测锚点附近的目标，因此更容易优化。此外，作者在每个锚点上加入了多个模式来解决一个区域中可能多个目标的问题。为了降低计算的复杂度，作者还提出..

2021-10-10 14:04:29 2249

原创论文阅读：Primitive Representation Learning for Scene Text Recognition

一、简介在本文中，提出了一种新的场景文本识别框架来学习场景文本图像的原始表示。将特征图中的元素建模为无向图的节点。使用池化聚合器和加权聚合器来学习原始表示，并通过图卷积网络转化为高级视觉文本表示。针对全局特征聚合，提出了一种池化聚合器和一种加权聚合器。对于池聚合器，每个原始表示都是通过两个卷积和一个全局平均池层从输入特征映射中学习的。通过这种方式，所有样本共享聚合权重，以从各种场景文本实例中学习内在的结构信息。对于加权聚合器，输入特征图被转换为样本特定热图，用作聚合权重。可视化文本表..

2021-06-24 17:16:59 1626 2

原创论文阅读：Improvement of End-to-End Offline HMER by Weakly Supervised Learning

一、简介提出了一种利用深度神经网络识别离线手写数学表达式(HMEs)的改进方法。使用弱监督学习来端到端地训练它。该网络有三个部分：使用卷积神经网络从输入HME图像编码高级特征；使用GRU的解码器来解析高级特征并生成LaTeX格式的输出表达式；以及一个符号分类器，以提高高级特征的定位和分类。此外，使用模型集成方法的束搜索过程来平均多个模型的概率。二、主要方法1、框架离线HME识别通常包括符号分割、符号识别、结构分析和上下文分析等模块。这些模块可以使用最新的神经网络和训练过的端到端网..

2021-06-10 15:24:35 278

原创论文浏览：Edge Based Graph Neural Network to Recognize Semigraph Representation of English Alphabets

一、jian'ji

2021-06-08 18:21:31 226

原创论文阅读：Stroke Based Posterior Attention for Online Handwritten Mathematical Expression Recognition

一、问题OHMER旨在将人类手写轨迹点的坐标转换为计算机可以处理的格式化文件，如LaTeX字符串和inkml。与在线手写文本识别问题相比，OHMER面临着两个独特的挑战：复杂的二维空间结构和较小的开放数据集。通常可以根据管道的数量将识别方法分为两种类型：两步方法[6]、[7]和端到端方法[2]、[8]、[9]。在两步方法中，第一条管道是识别轨迹点为数学符号的符号识别，第二条管道是从给定的数学符号解析公式结构的结构识别。符号识别可以通过神经网络或传统的方法[10]来实现。结构识别可以通过二维上..

2021-06-08 17:50:48 312

原创论文阅读：Improving Attention-Based HMER with Scale Augmentation and Drop Attention

一、解决问题传统的基于语法的方法，是通过符号分割、符号识别和结构分析来识别数学公式。许多HMER的DNN模型把HMER作为一个图像到序列的问题，如Image-2-Markup、WAP、Pattern generation strategies和paired adversarial learning。这些方法通常将识别文本标准化到某个固定的高度。但由于数学公式复杂的二维结构和不同尺寸的符号，规范化为相同的高度会降低识别性能。为了解决这个问题，本文提出了一种尺度扩展方法来生成数学公式图像，以此训练D..

2021-06-07 16:27:12 521

转载 Must-read papers on GNN for HMER

Must-read papers on GNN for HMERGNN: graph neural networkContributed by Jie Zhou, Ganqu Cui, Zhengyan Zhang and Yushi Bai.https://github.com/thunlp/GNNPapersServeyIntroduction to Graph Neural Networks. Synthesis Lectures on Artificial Intelligence

2021-06-03 12:16:58 220

原创基于Graphs的机器学习

当前主流的深度学习模型主要是为简单的序列数据或者格式化数据来设计的，如下图所示常见有图像数据、文本或者语音数据等。但是基于网络或者图的机器学习是相对困难的：图是没有固定的大小，并且是一个复杂的拓扑结构节点之前没有固定的引用顺序图时常是动态更新的并且具有多模态异构的特征 ...

2021-06-02 19:33:49 188

handsome_lionet的博客