![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
持续战斗状态
这个作者很懒,什么都没留下…
展开
-
多分类RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
比如二分类的标签应该是0,1。而不是1,2或其他。可以检查一下是不是多分类标签不是0开始。原创 2024-04-20 17:40:08 · 82 阅读 · 0 评论 -
UserWarning: Implicit dimension choice for softmax has been deprecated. Change the call to include d
这个警告信息是因为在调用 PyTorch 中的 softmax 函数时没有传入 dim 参数,导致 PyTorch 无法确定在哪个维度上进行 softmax 操作。其中 dim 参数的具体取值要根据数据的维度而定,一般情况下是对分类数所在的维度进行 softmax,例如对于图片分类任务,通常是对最后一维(即通道数)进行 softmax,因为最后一维的大小就是分类数。原创 2023-04-29 22:01:14 · 3323 阅读 · 0 评论 -
【实战】一键训练的公司名实体识别NER 基于Bert+crf
公司名实体识别NER 基于Bert+crf原创 2023-02-27 21:45:12 · 715 阅读 · 1 评论 -
【实战】使用Bert微调完成文本二分类
使用Bert微调完成文本二分类,包含实验数据、全部代码,一键运行原创 2023-02-21 21:53:06 · 837 阅读 · 1 评论 -
使用cpca快速识别地名
直接调用即可完成地名识别,需要安装cpca。原创 2022-12-13 20:18:37 · 232 阅读 · 0 评论 -
ModuleNotFoundError: No module named ‘sklearn‘
sklearn安装ModuleNotFoundError: No module named 'sklearn'原创 2022-11-10 14:16:29 · 898 阅读 · 1 评论 -
amrlib 安装测试
官网安装1.pip3 install amrlib(在amrlib可以找到requirements.txt)2.pip install unidecode3.在models下载想要的model4.放到E:\Anaconda3\envs\py37\Lib\site-packages\amrlib\data\model_stog5.测试:import amrlibstog = amrlib.load_stog_model()graphs = stog.parse_sents(['Th原创 2022-05-11 20:46:32 · 599 阅读 · 1 评论 -
‘BertTokenizer‘ has no len() additional_special_tokens add_tokens
增加special token的时候一直报错additional_special_tokens也不行,add_tokens也不行,len和vocab_size也不行后来发现是旧版本pytorch_pretrained_bert的问题:原来:from pytorch_pretrained_bert import BertAdamtokenizer = BertTokenizer(vocab_file=args.tokenizer_path)改为:from transformersimport原创 2022-05-10 12:32:30 · 403 阅读 · 0 评论 -
多分类数据不均衡:交叉熵CrossEntropyLoss加入权重
criterion = nn.CrossEntropyLoss( weight=torch.from_numpy(np.array([10.0,5.0,1.0,5.0,10.0])).float(), size_average=True)weight(Tensor, optional) - 每个类别class 的权重. 默认为值为 1 的 Tensor.size_average(bool, optional) – 默认为 True.— size_average=True, 则 losses原创 2022-05-08 02:37:00 · 2129 阅读 · 0 评论 -
有监督对比学习在分类任务中的应用 Supervised Contrastive Learning
1.对比学习一般泛式其中x+是和x相似的正样本,x-是和x不相似的负样本score是一个度量函数,来衡量样本间的相似度。如果用向量内积来计算两个样本的相似度,则对比学习的损失函数可以表示成:其中对应样本x有1个正样本和N-1个负样本。可以发现,这个形式类似于交叉熵损失函数,学习的目标就是让x的特征和正样本的特征更相似,同时和N-1个负样本的特征更不相似。2.对比学习分类「有监督对比学习」:通过将监督样本中的相同label的样本作为正样本,不同label的样本作为负样本,来进行对比学习;正样本:原创 2022-05-05 18:48:01 · 7162 阅读 · 0 评论 -
Multi-News: a Large-Scale Multi-Document Summarization Dataset 文本摘要笔记
文本摘要笔记1.Multi-News2.Pointer-generator Network3.Transformer4.MMR5.PG-MMR6.Hi-MAP7.First8.LexRank9.TextRank9.1 PageRank9.2 TextRank9.3 TextRank生成摘要10.实验10.1 评价指标10.2 实验结果1.Multi-NewsMulti-News: a Large-Scale Multi-Document Summarization Dataset and Abstrac原创 2022-03-19 19:25:03 · 821 阅读 · 0 评论 -
CUDA error: device-side assert triggered 分类任务报错
CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.For debugging consider passing CUDA_LAUNCH_BLOCKING=1.四分类的时候label是1-4,改成0-3即可...原创 2021-12-16 20:17:55 · 531 阅读 · 0 评论 -
Transformers使用bert模型预留的[unused*]时遇到的问题:torch.embedding IndexError: index out of range in self
先报错了CUDA error: device-side assert triggered然后模型放到cpu里查看具体原因,报错了:torch.embedding(weight, input, padding_idx, scale_grad_by_freq, sparse)IndexError: index out of range in self最后发现是因为改了bert预留的[unused*]导致的问题:tokenizer = BertTokenizer.from_pretrained(pret原创 2021-11-19 15:17:55 · 2495 阅读 · 3 评论 -
Synonyms 安装失败解决方法
直接下载词向量文件词向量文件下载地址放进这里anaconda3/envs/环境名/lib/python3.7/site-packages/synonyms/data然后直接运行就行了:import synonymsprint("人脸: ", synonyms.nearby("人脸"))print("识别: ", synonyms.nearby("识别"))print("NOT_EXIST: ", synonyms.nearby("NOT_EXIST"))Synonyms的GitHub地址原创 2021-11-18 19:23:01 · 3614 阅读 · 1 评论 -
gensim实现TF-IDF和LDA模型、sklearn实现聚类
目录gensim实现TF-IDF和LDA模型,sklearn实现聚类1.数据处理1.1 分词1.2 清洗2 gensim构造Dictionary、corpora以及使用TF-IDF2.1 词典创建2.2 corpus创建2.3 词袋转为TF-IDF3 创建LDA模型3.1 结果查看3.2 评估指标4.sklearn实现聚类4.1 构造特征4.2 KMeans4.3 评估指标gensim实现TF-IDF和LDA模型,sklearn实现聚类1.数据处理假如我有1000篇文章,每篇文章形如:本发明公开的一原创 2021-11-01 21:07:32 · 4575 阅读 · 7 评论 -
TOWE:Leveraging Position Embeddings for Target-oriented Opinion Words Extraction笔记
An Empirical Study on Leveraging Position Embeddings for Target-oriented Opinion Words Extraction利用位置嵌入提取目标导向意见词的实证研究0 摘要1 介绍0 摘要面向目标的意见词抽取(TOWE) 是面向目标的情感分析的一个新的子任务,旨在为文本中给定的方面抽取意见词。当前最先进的方法利用位置嵌入来捕捉单词与目标的相对位置。然而,这些方法的性能取决于将这些信息合并到单词表示中的能力。在本文中,我们探索了各种基于原创 2021-11-01 21:23:44 · 390 阅读 · 0 评论 -
Anaconda3直接安装pytorch,免安装cuda和cudn
1.安装Anaconda3和pycharm2.打开Ananconda promote,输入nvidia-smi,查看对应CUDA版本3.使用清华镜像源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/4.在https://pytorch.org/,查看对应CUDA的安装命令。比如:conda install pytorch torchvision cudatoolkit=原创 2020-12-19 22:13:17 · 1273 阅读 · 4 评论 -
from torchcrf import CRF 如何安装torchcrf
安装torchcrf错误1:pip install torchcrf错误2:pip install pytorch-crf==0.4.0解决:第二个安装后需要先卸载:(没安装过可跳过这一步)pip uninstall pytorch-crf==0.4.0然后:pip install pytorch-crf原创 2020-12-19 21:55:12 · 13879 阅读 · 6 评论