nlp学习之路
文章平均质量分 83
记录nlp学习笔记
Momo_159357
少年要横冲直撞,无所畏惧!
展开
-
人工智能入门杂记
机器学习:人们输入数据和从这些数据中预期得到的答案,系统输出规则(训练)。预测/推理:这些规则随后应用于新的数据,并使计算机自主生成答案。原创 2023-01-25 17:40:23 · 823 阅读 · 1 评论 -
机器学习——不成体系
记录了一些目前在自己的知识库中不成体系但又很重要的知识点吧。原创 2023-03-26 22:13:36 · 463 阅读 · 0 评论 -
机器学习(一)——基础概念
机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新知识或技能,重新组织已有的知识结构使之不断改善自己的性能。机器学习是人工智能的一个分支。我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断学习和改进,通过参数优化的学习模型,能够用于预测相关问题的输出。原创 2023-01-25 10:07:31 · 1455 阅读 · 0 评论 -
机器学习(二)--NumPy
本篇文章介绍了一些Numpy的基础操作。NumPy 是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。原创 2023-01-25 23:33:25 · 407 阅读 · 0 评论 -
论文阅读:CIL: Contrastive Instance Learning Framework for Distantly SupervisedRelation Extraction
🌳方法:将初始的MIL框架视为 bag encoder,它为不同的关系三元组提供了相对准确的表示,然后开发对比实例学习(CIL),以一种无监督的方式利用每个实例。🌳目标:CIL的目标是共享相同三元组的实例在语义空间中应该很接近,而具有不同关系三元组的实例的表示应该很远。原创 2023-05-26 17:13:22 · 321 阅读 · 1 评论 -
浅学一下schema
Schema是一种数据结构,用于表示一组实体和它们之间的关系。在自然语言处理中,schema 指的是文本或语句中涉及的实体和它们之间的关系,是解析和理解文本的重要工具。关系抽取是自然语言处理中一种重要的任务,它指的是从文本中识别出实体之间的关系。关系抽取可以利用语法结构、语义角色标注、命名实体识别等技术来实现。在知识图谱中,关系抽取是构建知识图谱的基础,它提取出的关系可以用来建立实体之间的边。原创 2023-01-20 17:39:36 · 1891 阅读 · 1 评论 -
TextRank关键词提取算法
同样的如果这个很重要的节点,它的外链数很少,那么这个被链接的点显然也很重要。2.对每个句子进行分词,并做词性标记,然后去除停用词,只保留指定词性的词(如名词、动词、形容词)1.先将整个万维网看作是一张有向图,网页构成了图中的节点.每个节点额权重作为其重要性的度量。5.对各个节点的权重进行倒序排序,得到最重要的N个单词,作为top-N关键词进行输出。计算每个句子给它链接句的贡献时,是通过计算权重占总权重的比例来分配的。4.迭代计算各个节点的权重,直至收敛,得到各节点重要性的分值。原创 2022-10-16 15:29:30 · 2258 阅读 · 2 评论 -
复现Incorporating Hierarchy into Text Encoder遇到的问题
先总结一下:就是看好自己的pytorch和cuda的版本,对准版本选择合适的包进行安装,安装的时候要写明包的版本和相应的网址,不然会自动匹配最新版本,下载错还好操作,要是顺带修改别的包的版本,可能就要重新再来一遍了。重新来了一次,python=3.9 ,torch==1.12.0 ,cuda==11.6(这个环境是gl大大配的)如果如果不行的话,尝试换用更高版本的python,我们刚开始使用的是3.7的后来变成了3.9的。百度了很多,发现是版本不匹配,然后就开始了漫长的版本匹配历程。下载完就可以运行了~原创 2022-10-06 22:09:47 · 575 阅读 · 2 评论 -
环境配置(一)
报错: torchvision 0.11.3 requires torch==1.10.2, but you have torch 1.12.0 which is incompatible.修改成: pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名。重新下载torch,刚刚下载的好像还是cuda102的。执行的时候要把-c pytorch去掉。问题二:查看pytorch版本。然后下载对应版本 (官方给的)切记要匹配系统的版本。原创 2022-09-30 20:49:30 · 5247 阅读 · 3 评论 -
NLP入门-词向量
🌳🌳🌳前言:本文总结了介绍了词向量的两种表示方式:one-hot表示和分布式表示🌈在自然语言处理任务中,首先要考虑字、词如何在计算机中表示,通常有两种表示方式:one-hot表示和分布式表示。🌸one-hot表示(离散式表示)one-hot表示就是把每个词表示为一个长向量。 这个向量的维度是词表的大小。 向量中只有一个维度的值为,其余维度的值为0。🌰举个例子:苹果 [0,0,0,1,0,0,0,0,···] 。🌟one-hot相当于给每个词分配一个id,这......原创 2022-04-29 10:09:40 · 806 阅读 · 0 评论