mrweiqk-CSDN博客

原创【RAG探索第4讲】KG+RAG丨基于知识图谱优化大型语言模型方法

今天给大家带来一些知识图谱+RAG的参考案例。

2024-07-16 10:59:23 1603

原创【RAG探索第3讲】LlamaIndex的API调用与本地部署实战

今天给大家带来一个llamaindex的实战。分为两个部分，调用ChatGLM的API来用llamaindex和本地部署qwen1.5使用llamaindex。

2024-07-06 13:43:21 3819 1

原创【RAG探索第2讲】大模型与知识图谱的融合之路：优势互补与协同发展

如下图的（a）所示，KG-BERT将三元组的实体和关系的文本直接组成句子输入LLM用以编码，然后得到的嵌入输入一个简单的多层网络，通过sigmoid函数进行二值分类判断该三元组是否存在。最近的工作在KGC中使用LLM作为Sequence2Sequence的生成器，所使用的LLM包括Encoder-Decoder或仅使用Eecoder-only的LLM。一个简单的方法是利用一个双塔架构，其中，一个单独的模块处理文本输入，另一个模块处理相关的知识图输入。首先对输入的KG进行编码，然后增加输入的文本表示。

2024-07-04 15:06:06 2625

原创【RAG探索第1讲】通过大模型读取外部文档的创新探索与自适应策略

如何通过大模型来读取外部文档？在读取文档的过程中，如何根据问题难度自适应读取外部文档？

2024-07-03 16:38:49 990

原创 3090显卡+CUDA11.0+torch1.7.1

centos+torch+torchvision+cuda+cudnn_nonet安装安装指定版本的python下载CUDA以及安装配置CUDA的PATH环境下载Cudnn以及安装参考大背景：服务器没有网络，新安了一块3090显卡，原有的服务器内存为64G，硬盘大小为500G，torch笨笨为cpu版本的，所以需要重新配置系统环境。当前服务器没有办法链接到网络，安装安装指定版本的python下载CUDA以及安装首先去指定网址下载CUDA版本11.1版本：https://developer.nvi

2020-12-19 15:06:27 7061 2

原创一文带你学会关键词提取算法---TextRank 和 FastTextRank实践

一文带你学会关键词提取算法---TextRank 和 FastTextRank实践

2024-06-30 19:34:18 1246

原创大模型名词扫盲贴

一文带你了解基本的大模型名词

2024-06-18 18:06:17 1009

原创提升大型语言模型性能的新方法:Query Rewriting技术解析

此外，为了更好地将查询与冻结模块对齐，我们为我们的管道提出了一个可训练的方案。实验结果显示了一致的性能改进，表明我们的框架被证明是有效的和可扩展的，并为检索增强的LLM带来了新的框架。这项工作从查询重写的角度引入了一个新的框架，Rewrite-RetrieveRead，而不是以前的检索增强LLM的检索然后读取。为了解决这些问题，研究者们提出了检索增强的方法，通过检索模块为语言模型提供相关的外部知识。B：将输入使用LLM进行改写成query，将这个query输入到web进行检索，得到检索后的文档。

2024-06-18 11:34:47 1294

原创 RAG实战-QAnything

QAnything（基于任何事物的问答）是一个本地知识库问答系统，旨在支持多种文件格式和数据库，允许离线安装和使用。有了QAnything，您只需放置任何格式的本地存储文件即可获得准确、快速、可靠的答案。目前支持的格式包括：PDF(pdf)、Word(docx)、PPT(pptx)、XLS(xlsx)、Markdown(md)、Email(eml)、TXT(txt)、Image(jpg，jpeg，png)、CSV(csv)、Web links(html)以及即将推出的更多格式……（3）拉取模型并运行。

2024-06-16 11:41:48 1059

原创论文笔记丨Inductive Unsupervised Domain Adaptation for Few-Shot Classification via Clustering

Inductive Unsupervised Domain Adaptation for Few-Shot Classification via ClusteringAbstractIntroductionAbstract小样本学习致力于不同域之间的学习，由于域和域之间重叠的标签有限，使得传统域适应受到限制，本文提出一种DaFeC，构建表示提取器从目标域为未标注数据抽取特征，用一个cluster miner对特征进行分组。生成的伪标记数据和标记的源域数据用来更新少量分类器的参数，为了收集高质量的伪标签.

2021-06-22 15:39:36 428 1

原创 github问题合集

添加合作者:https://www.cnblogs.com/wanglan/p/10714140.htmlgit文件的基本操作：git clone XXXXXX.git#可以用hettp或者ssh 我用ssh的成功率较高git add . # 注意这里有一个.git commit -m "init" git push #如果是第一次提交需要写github账号的邮箱和用户名参考链接https://www.cnblogs.com/cxk1995/p/5800196.html第一次是用这个链接成

2021-06-18 20:16:43 261

原创论文笔记丨Open Hierarchical Relation Extraction

Open Hierarchical Relation ExtractionAbstractAbstract开放关系提取（OpenRE）旨在从开放域语料库中提取新的关系类型，在完成知识库（KBs）的关系方案（relation schemes）方面发挥着重要作用。大多数OpenRE方法在不考虑其分层依赖性的情况下，孤立地投射不同的关系类型。我们认为OpenRE在与关系层次结构密切相关的情况下固有。为了解决OpenRE和关系层次结构之间的双向连接，我们提出了开放分层关系提取的任务，并为任务提供了一种新颖的O.

2021-06-08 15:37:10 610 1

原创 NAACL2021丨Knowledge Guided Metric Learning for Few-Shot Text Classification

Knowledge Guided Metric Learning for Few-Shot Text ClassificationAbstractIntroductionContributions：MethodologyExperiment resultAbstract人类可以在很少的例子中非常有效地区分新类别，主要是由于人类可以利用从相关任务获得的知识。然而，基于深度学习的文本分类模型往往会在标记数据稀缺时难以实现满意的性能。由此，我们在小样本学习任务上引入外部知识。为此我们提出一种新的参数生成器网.

2021-05-25 17:42:27 389

原创论文笔记丨Multi-Level Matching and Aggregation Network for Few-Shot Relation Classification

作者：魏启凯单位：燕山大学论文：https://arxiv.org/pdf/1906.06678.pdfcode：https://github.com/ZhixiuYe/MLMAN来源：ACL2019——————————————————————————————————创新：提出一种多级匹配和聚合网络，以交互的方式来encode查询集实例和类原型。设计了一种辅助loss function来一致的测量支持集...

2021-04-27 09:53:05 602 1

原创 AAAI2019丨Hybrid Attention-Based Prototypical Networks for Noisy Few-Shot Relation Classification

清华基于混合注意力的原型网络解决关系抽取问题

2021-04-21 12:57:13 706

原创论文笔记丨Confidence Modeling for Neural Semantic Parsing

题目：Confidence Modeling for Neural Semantic Parsing神经语义解析的置信度建模abstract造成不确切的三种原因：模型不确定性，数据不确定性和输入不确定性。并设计了各种指标来量化这些因素，这些度量随后用来估计置信度分数。introduction目的是预测一个东西是否可信。语义解析通常用于构建自然语言接口，例如对话系统。在这种情况下，重要的是要知道系统是否以较高的置信度理解输入查询，以便更可靠地做出决策模型确实确实会产生不确定的输出，我们希望我们的框架

2021-04-20 09:15:51 270 1

原创损失爆炸梯度爆炸解决办法

检查代码有无问题，这是一个很重要原因。比如该是5的地方写成了6，或者变量导入错误等等。检查所有的权重有无经过正则化，比如有些权重值是7.5，-8.6等等这肯定引起loss变大。使用drop，batchnormal等等正则化数据。...

2021-03-25 10:31:38 376

原创错误代码0xc000007b+bootsafe64_ev.sys错误

今天早晨来到实验室突然发现电脑无法正常开机。解决办法：1.网上说本地直接删除c:\windows\system32\drivers\bootsafe64_ev.sys文件和kavbootc.sys文件。于是：高级选项->进入命令提示行。输入对应指令发现并没有这两个文件，而且在这个状态下没有办法进入到其他盘符进行备份桌面文件，此时很失望，做好了重装系统的准备。2. U启进入后，可以登录自己电脑的C盘对应的驱动位置c:\windows\system32\drivers，发现真的有这两个文件，删

2020-12-29 14:13:51 5326 4

原创论文笔记丨Knowledge Graph Embedding with Entity Neighbors and Deep Memory Network

abstract知识图嵌入（KGE）旨在表示低维连续向量空间中的知识图的实体和关系。最近的工作集中在将结构知识与其他信息（例如实体描述，关系路径等）结合在一起。但是，常用的附加信息通常包含大量噪声，这使得很难学习有价值的表示形式。在本文中，我们提出了一种新的附加信息，称为实体邻居，它包含有关给定实体的语义和拓扑特征。然后，我们开发一个深度内存网络模型来编码来自邻居的信息。利用门控机制，结构和邻居的表示被集成到联合表示中。实验结果表明，我们的模型优于使用实体描述的现有KGE方法，并在4个数据集上实现了最新的

2020-12-21 19:42:55 551 1

原创 ubuntu挂靠文件和网络设置

ubuntu挂靠文件和网络设置挂靠文件emergency model 解决办法网络设置前天自己拆了服务器（想给服务器装两块外挂硬盘），这就需要把所有的网线和电源线拆掉，于是造成了很多问题，比如校园网的其他节点无法访问该服务器。于是开始寻找原因。系统ubuntu 16.04reboot # 重启挂靠文件挂靠文件：1. 首先在ubuntu上插入自己的移动硬盘（或固态）2. 查看插入移动硬盘前后硬盘的分区变化：lsblk -f3. 创建挂载点：sudo mkdir /storage4.

2020-12-21 19:34:02 386 1

mrweiqk的博客