机器学习_六六六六神的博客-CSDN博客

机器学习

关注

文章平均质量分 51

关注数：文章数：18 文章阅读量：66139 文章收藏量：335

作者: 六六六六神

学习ing

展开

使用spacy规则化提取自然语言文本信息

1. 安装spacypip install spicyspicy还需要载入文本库，使用pip的下载方式：python3 -m spacy download en_core_web_sm但是很有可能因为网络问题下载速度非常缓慢，所以可以选择到github上去直接下载（注意和自己的spacy版本匹配）：github下载链接下载*.tar.gz文件即可。然后切换到下载路径，pip install en_core_web_sm-3.1.0.tar.gz2. spacy的一些基础用法使用spa

原创 2022-05-13 18:53:46 · 1239 阅读 · 0 评论
用于图像描述的评价指标CIDEr讲解

参考文献：《CIDEr: Consensus-based Image Description Evaluation》1. 主要思想CIDEr是专门用于评价图像描述(image caption)任务的评价指标，当然用于其他相关文本生成类任务也是可以的。相较于常用于文本翻译的评价指标BLEU、ROUGE来说，CIDEr更接近人类去判断两个句子是否相近的原理，因为它利用了TF-IDF来对不同n-gram去赋予不同的权重，直观的来说，即经常出现的词组的权重具有更低的权重，而不常出现的词组则更特殊（具有更大的权重

原创 2022-05-07 20:42:18 · 6403 阅读 · 0 评论
使用与下载huggingface的各种预训练模型的方法

- 引用方法huggingface上开源的预训练模型可不要太多，官网如下：huggingface，可自行搜索想要的模型。使用只需下载好transformers即可：pip install transformers引用模型也很简单，三句话搞定：from transformers import AutoTokenizer, AutoModeltokenizer = AutoTokenizer.from_pretrained("simbert-chinese-base")model = AutoM

原创 2022-04-07 14:12:35 · 6505 阅读 · 0 评论
解决pytorch中前向传播莫名其妙出现NAN的问题

问题描述使用pytorch对网络模型进行训练的时候，莫名其妙出现了数据NAN的问题，在反复确认读入数据没有问题（已经归一化），且网络模型加载权重也没问题的情况下，发现这种前向传播出现NAN属于薛定谔现象…即有时候会发生，有时候不发生，甚至使用相同的代码连续对同一个操作进行两次计算后结果第一次是NAN，第二次就正常。。解决方法灵感来源：https://discuss.pytorch.org/t/well-formed-input-into-a-simple-linear-layer-output-nan

原创 2022-03-30 20:36:18 · 3746 阅读 · 0 评论
【PyTorch】使用DataLoader自定义数据集读取

【PyTorch】使用DataLoader自定义数据集读取为了方便之后使用PyTorch的distributed部署，加速训练，将数据读取的方式改为适配pytorch提供的Dataset和DataLoader的方式。这里记录一下修改的要点：1. 涉及的import库：import torchfrom torch.utils.data import Dataset, DataLoader2. 自定义一个Dataset类：该类继承Dataset;可以定义若干个数据预处理的函数，关键的两个

原创 2022-02-25 15:10:21 · 2413 阅读 · 0 评论
基于pytorch使用wmd实现句子语义匹配算法

1. 安装相关包（1）spacygithub地址：https://github.com/explosion/spaCypip install spacypython -m spacy download en_core_web_sm # 安装模型包python -m spacy download en_core_web_md # 安装模型包（2）wmdgithub地址：https://github.com/src-d/wmd-relaxpip install wmd2. Python D

原创 2021-11-08 11:32:22 · 333 阅读 · 1 评论
Pytorch用next()的时候抛出StopIteration的错误的解决方法

我在训练vilbert的时候，报错如下： File "/vilbert/vilbert.py", line 1351, in forward dtype=next(self.parameters()).dtypeStopIteration查了一下可能是pytorch版本问题，所以有两种解决方法：解决方法一降级pytorch==1.4.0解决方法二修改代码：extended_attention_mask = extended_attention_mask.to(dtype=next

原创 2021-09-13 10:25:53 · 1958 阅读 · 0 评论
Ubuntu16.04安装matterport3D simulator的方法

Ubuntu16.04安装matterport3D simulator的方法Matterport3D是一个非常好的3D的RGB-D数据集，可以用在很多相关领域。Vision-and-Language Navigation问题使用的R2R数据集就是依托于matterport3D制作的。本文主要记录一下博主如何使用Ubuntu16.04来安装这个模拟器和数据集的。首先放Matterport3D的github地址：https://github.com/peteanderson80/Matterport3DSi

原创 2021-08-22 16:32:30 · 5888 阅读 · 28 评论
pytorch转为onnx格式，以及加载模型的params和GFLOPs方法

pytorch转为onnx格式：def Torch2Onnx(model,input_size,output_name,istrained=True): ''' :param: model :param: input_size .e.t. (244,244) :param: output_name .e.t. "test_output" :param: if convert a trained model or not. default: True '''

原创 2021-03-09 16:49:16 · 1957 阅读 · 5 评论
【自用】PyTorch实现神经网络模型的代码（小技巧

以自己写的vgg模型为例：import torchimport torch.nn as nnimport numpy as npimport collectionsdef conv(in_channels, out_channels, kernel_size, stride=1, padding=0, bn=0, relu=1, pooling=0): modules = [nn.Conv2d(in_channels,out_channels,kernel_size,stride=str

原创 2020-09-01 09:43:30 · 503 阅读 · 0 评论
pytorch重载optimizer参数时报错：RuntimeError: expected device cpu but got device cuda:0的解决方法

1. 问题描述：我在使用torch.save()保存了optimizer的参数过后，torch.save( { 'state_dict':net.state_dict(), 'optimizer':optimizer.state_dict(), 'epochID':epo...

原创 2020-04-22 10:23:57 · 5845 阅读 · 12 评论
调用cocoeval时报TypeError的解决方法

问题描述：我在调用cocoeval计算map时，发生报错：TypeError: object of type <class ‘numpy.float64’> cannot be safely interpreted as an integer经查，错误主要发生在pycocotools/cocoeval.py下面这一行代码：self.iouThrs = np.linspace(.5...

原创 2020-03-16 17:28:20 · 1457 阅读 · 1 评论
PyTorch训练与测试模型分别在GPU和CPU上的灵活转换

由于抢不到实验室的gpu资源，决定把毕设需要的训练部署在远程cpu服务器上（gpu服务器太贵搞不起），为了测试模型在gpu和cpu之间来回转换时是否会影响模型的性能，特别做了以下实验。- 首先明确测试的四种情况：Device_TrainDevice_TestGPUGPUGPUCPUCPUGPUCPUCPU把数据部署在GPU/CPU上：（...

原创 2020-03-13 13:30:40 · 4258 阅读 · 1 评论
基于Pytorch和tensorboard实现深度神经网络训练及可视化的例子

最近在学习pytorch实现深度神经网络的教程，强推deeplizard的系列教程，有能力的可以自己去搜索一下原地址，虽然是全英文教程但以我托福听力18分的水平（哭了）也全程听完了，另外在优兔上面还可以按快捷键C开启自动字幕，不过这个自动字幕吧感觉开了还不如不开emmm，总之强烈推荐，真的讲的特别好！B站链接：https://www.bilibili.com/video/av78848066以...

原创 2020-03-10 15:59:39 · 580 阅读 · 0 评论
【机器学习】西瓜书_周志华，习题9.4，编程实现k均值算法+绘图（python）

【机器学习】西瓜书_周志华，习题9.4，编程实现k均值算法1. 核心算法：k均值算法作为原型聚类算法的一种，其主要目标最小化平方误差，通过不断迭代更新均值向量，从而得到新的簇分类。（使簇内距离最小）具体算法如上图所示。2. 具体实现：# -*- coding: utf-8 -*-#author: w61import randomimport mathimport matplo...

原创 2019-11-29 15:06:30 · 2437 阅读 · 0 评论
【机器学习】西瓜书_周志华，习题集6.2，使用LIBSVM在西瓜数据集3.0a上分别用线性核和高斯核训练一个SVM，并比较其支持向量的差别。

【机器学习】西瓜书_周志华，习题集6.2，使用LIBSVM在西瓜数据集3.0a上分别用线性核和高斯核训练一个SVM，并比较其支持向量的差别。参考资料：LibSVM： https://www.csie.ntu.edu.tw/~cjlin/libsvm/github： https://github.com/cjlin1/libsvm1. 环境：Windows10 + python3.5.42...

原创 2019-10-30 20:55:28 · 9923 阅读 · 1 评论
【机器学习】西瓜书_周志华，python实现基于信息熵进行划分选择的决策树算法

python：实现基于信息熵进行划分选择的决策树算法本文主要介绍本人用python基于信息熵进行划分选择的决策树代码实现，参考教材为西瓜书第四章——决策树。ps.本文只涉及决策树连续和离散两种情况，未考虑缺失值和剪枝。首先摘取一些书上比较关键的理论知识：1.决策树学习基本算法显然，决策树是一种递归算法，递归最重要的一点是return条件的设置，这里主要有三种情况会产生return：当...

原创 2019-10-08 11:27:51 · 4961 阅读 · 4 评论
【机器学习】西瓜书_周志华，MATLAB编程实现线性判别分析，给出西瓜数据集3.0a上的结果。

参考博客：https://blog.csdn.net/qq_20406597/article/details/80166589MATLAB编程实现线性判别分析，给出西瓜数据集3.0a上的结果。1.线性判别分析理论LDA（Linear Discriminant Analysis）的思想非常朴素：找出一条支线，使同类的样本在直线上的投影点尽可能近，异类的样本在直线上的投影点尽可能远。涉及的公...

原创 2019-09-21 16:16:47 · 5797 阅读 · 4 评论

机器学习

作者: 六六六六神

使用spacy规则化提取自然语言文本信息

用于图像描述的评价指标CIDEr讲解

使用与下载huggingface的各种预训练模型的方法

解决pytorch中前向传播莫名其妙出现NAN的问题

【PyTorch】使用DataLoader自定义数据集读取

基于pytorch使用wmd实现句子语义匹配算法

Pytorch用next()的时候抛出StopIteration的错误的解决方法

Ubuntu16.04安装matterport3D simulator的方法

pytorch转为onnx格式，以及加载模型的params和GFLOPs方法

【自用】PyTorch实现神经网络模型的代码（小技巧

pytorch重载optimizer参数时报错：RuntimeError: expected device cpu but got device cuda:0的解决方法

调用cocoeval时报TypeError的解决方法

PyTorch训练与测试模型分别在GPU和CPU上的灵活转换

基于Pytorch和tensorboard实现深度神经网络训练及可视化的例子

【机器学习】西瓜书_周志华，习题9.4，编程实现k均值算法+绘图（python）

【机器学习】西瓜书_周志华，习题集6.2，使用LIBSVM在西瓜数据集3.0a上分别用线性核和高斯核训练一个SVM，并比较其支持向量的差别。

【机器学习】西瓜书_周志华，python实现基于信息熵进行划分选择的决策树算法

【机器学习】西瓜书_周志华，MATLAB编程实现线性判别分析，给出西瓜数据集3.0a上的结果。