坑
NuerNuer
这个作者很懒,什么都没留下…
展开
-
RuntimeError: Tensor must have a last dimension with stride 1
我在使用torch.view_as_complex将weight转化为复数时,遇到了这样一个错误:由于我在对weight使用view_as_complex之前使用了F.interpolate函数进行了分辨率调整,因此只需对张量weight添加.contiguous()即可。原创 2024-05-08 17:19:01 · 334 阅读 · 0 评论 -
坑 之 Ubuntu Conda虚拟环境使用faiss-gpu报错分析及解决办法
faiss-gpu的使用于cuda版本是紧密相关的,cuda又是与nvidia driver紧密相关的,nvidia driver又是与显卡紧密相关的原创 2023-05-16 22:44:56 · 5816 阅读 · 2 评论 -
LeTax记录\documentclass{},authoryear属性使用
关于elsevier期刊中引用格式的一些记录原创 2022-07-26 20:29:15 · 699 阅读 · 0 评论 -
记录之使用3080ti运行tensorflow-gpu=1.x版本的源码
环境:Anaconda3,ubuntu18.04,RTX3080ti,python3.7RTX3080ti显卡是当前市面上比较新的,算力比较强的显卡,且这类显卡采用了安培架构仅支持cuda11.x及以上版本。关于tf-gpu,cuda,cudnn间的对应关系,我们可以查看:从源代码构建 | TensorFlow关于驱动和cuda,cudnn的对应关系,我们可以查看:Release Notes :: CUDA Toolkit Documentation##问题1:我的30系列卡的驱动为450.x.x..原创 2021-11-29 22:20:15 · 3123 阅读 · 4 评论 -
ValueError: invalid literal for int() with base 10 与数据类型有关的转换报错
1.ValueError: invalid literal for int() with base 10a是一个字符串,例如‘108.8’报错原因:直接对a进行int(a)操作,语法不允许解决办法:int(float(a)) 或 round(float(a)),即先将字符串其转换为浮点型数据,再进行取整2.TypeError: Cannot cast array data from dtype(‘float64‘) to dtype(‘<U32‘)....报错原因:‘U32’和’S32’都.原创 2021-09-12 21:10:42 · 2464 阅读 · 0 评论 -
OpenCV报错Expected Ptr<cv::UMat> for argument ‘%s‘
在使用opencv处理图像时,使用cv2.imwrite()保存图像时总是报错:Expected Ptr<cv::UMat> for argument '%s'查阅资料发现,在cv::UMat在传参时,类型须为np.float32,传入其他类型(例,np.int32)会报错解决办法:img_ = np.float32(img)......cv2.imwrite('a.jpg', img_)即,将其他类型的的数据通过函数转换为np.float32...原创 2021-09-03 22:26:02 · 4287 阅读 · 1 评论 -
报错 之 from typing import OrderedDict ImportError: cannot import name ‘OrderedDict‘ from ‘typing‘
from typing import OrderedDict ImportError: cannot import name 'OrderedDict' from 'typing' (E:\Python\lib\typing.py)。这样一个问题在网上没有搜到想要的答案,因此仔细看了报错的源码,发现在"E:\Python\lib\site-packages\git\config.py", 的48 行 from typing import OrderedDict 报错,我们看报错的地方,会发...原创 2021-08-07 19:53:09 · 24840 阅读 · 8 评论 -
记录 之 TypeError: ‘int‘ object is not subscriptable
翻译报错:int型对象是不可以下标访问的,即你错误的给int数据添加了下标显而易见的例子:a = 35b = a[0]很明显,a是一个int型变量,但是错误的添加了下标调用原创 2021-08-05 22:30:47 · 1479 阅读 · 0 评论 -
解决:ubuntu18.xx 更新nvidia驱动后,重新启动后黑屏
机器上安装驱动后,重新启动后黑屏,解决流程。1.Ctrl+Alt+F1进入recovery模式2.输入用户名和密码进入3.使用命令删除已安装的nvidia驱动:sudo apt-get remove --purge nvidia*sudo reboot原创 2021-05-16 10:56:39 · 3121 阅读 · 1 评论 -
报错 之 ModuleNotFoundError: No module named ‘setproctitle‘
正常报这种错误是因为模块缺失,我们正常安装即可:pip install -ihttps://pypi.tuna.tsinghua.edu.cn/simplesetproctitle但是有时在安装时会遇到新的问题:AttributeError: module 'enum' has no attribute 'IntFlag'错误原因:这篇文章介绍的相对清楚,https://blog.csdn.net/weixin_41010198/article/details/87255393这个..原创 2021-05-09 18:30:08 · 3703 阅读 · 0 评论 -
安装scipy报错,疑似缺少wheel包,解决方案
先说一下报错信息:使用pip3安装scipy包,报错。ERROR: Could not build wheels for scipy which use PEP 517 and cannot be installed directly网上关于这类问题的解决方案较少,我简单的记了几个原因:1.有人说是numpy和scipy版本不一致,还有就是安装顺序也会造成影响(但之前怎么没有遇到过这问题?误打误撞?)2.有人说是缺少某某wheel包3.有人说把pip升级......上述几种我都试了,但是我原创 2021-04-27 10:26:01 · 6596 阅读 · 3 评论 -
记录 之 离线安装docker
最近在做的一个项目,因为种种原因,服务器的yum在下载的时候总是报无法解析域名,找不到软件包的错误,导致我无法正常的按照标准的方式来安装docker,所以就只能采取离线安装的方式。首先说说明我的机器环境的基本情况。arm64架构(aarch64),Red Hat 8.3.1-5(Centos 8)使用下列指令查看本机操作系统版本及架构:cat /proc/version我采用的是下载tgz包的方式进行安装。还有一种方式是下载rpm包进行安装,两种安装方式会存在一些差别下载自己需要的docker原创 2021-04-17 11:14:38 · 247 阅读 · 0 评论 -
linux服务器cuda,cudnn的安装与卸载
写在前面,抛开nvidia驱动和tf-gpu版本谈cuda及cudnn的安装都是耍流氓。大家一定要注意版本对应关系,我遇到了几个典型的因版本不对应导致的问题,我会写在本文后面。机器显卡为tesla t4.安装的驱动为418.81.07;安装的cuda版本为cuda10.0 ;cudnn版本为7.6.5;tf-gpu版本为1.14.01.卸载旧版本:cuda的默认安装在 /usr/local/下,用下面的命令卸载:sudo /usr/local/cuda-x.x/bin/uninstall_c原创 2021-04-13 22:50:33 · 4252 阅读 · 0 评论 -
linux服务器nvidia驱动的安装与卸载
一.卸载有两种方式:(1)sudo apt-get install autoremove --purge nvidia*有的时候这个命令会不好用,本人暂不知道原因,可以采用方式二(2)sudo /usr/bin/nvidia-uninstall采用 nvidia-smi命令,发现command not found,就说明成功卸载二.安装nvidia驱动下载:https://www.nvidia.cn/Download/index.aspx?lang=cn安装步骤:https://blog原创 2021-04-13 18:29:12 · 6602 阅读 · 1 评论 -
docker使用镜像报错:standard_init_linux.go:211: exec user process caused “exec format error“
在服务器使用镜像运行代码时出现了该报错。使用了docker run 后,由于是刚接触docker,不知道是什么原因。经网上查阅资料后,了解到原来有可能是我的镜像架构和机器架构不一致。使用 docker inspect 命令调出我的镜像架构:是arm64使用uname -a指令查看机器架构:是x86_64相关解决办法:1.https://blog.csdn.net/hhyywwai/article/details/1083699842.https://blog.csdn.net/xiang_f原创 2021-04-10 21:32:50 · 10570 阅读 · 0 评论 -
Docker环境下:ImportError: libSM.so.6: cannot open shared object file: No such file or directory
在使用docker利用镜像运行代码的时候遇到了这个问题,困扰了我很长时间。我试过网上的两种方法,一种是yum安装相关依赖。另一种是apt-get安装相关依赖。但是这两种方法都没有解决我的问题。感兴趣的同学可以去试一下我最后的解决办法是: pip install opencv-python-headless pip install opencv-contrib-python-headless 安装上述两个版本的opencv-python。特此记录...原创 2021-04-09 17:45:53 · 514 阅读 · 0 评论 -
Docker环境下报错:unknown group ‘mlocate‘ in statoverride file E: Sub-process /usr/bin/dpkg
先说一下我的问题,我是在docker下运行代码,然后在使用apt-get 来install包的时候,遇到这样的问题。在裸机上运行的话也许会对你有帮助解决办法:我们去到/var/lib/dpkg/路径下,打开statoverride文件,将“mlocate”删除。这个问题就可以解决类似的如果遇到类似unknown group ‘xxxx’ 的问题,可以尝试这种解决办法。...原创 2021-04-09 17:29:21 · 1456 阅读 · 3 评论 -
tf记录 之 tf.boolean_mask函数
tf.boolean_mask 的作用是 通过布尔值 过滤元素def boolean_mask(tensor, mask, name="boolean_mask", axis=None): """Apply boolean mask to tensor.tensor:被过滤的元素mask:一堆 bool 值,它的维度不一定等于 tensorreturn: mask 为 true 对应的 tensor 的元素当 tensor 与 mask 维度一致时,return 值为一维那么r原创 2021-03-15 23:04:23 · 471 阅读 · 0 评论 -
tf之ValueError: Tried to convert ‘values‘ to a tensor and failed. Error: None values not supported
在实验中遇到这个问题:ValueError: None values not supported.经查阅资料发现,是因为有的变量没有被求梯度,因此在计算利用梯度反向更新时会造成这种错误。这里,我的代码是: update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS) with tf.control_dependencies(update_ops): optimizer = tf.train.MomentumOptimiz原创 2021-03-15 22:55:32 · 3751 阅读 · 0 评论 -
坑 之 TypeError: Cannot create initializer for non-floating point type.
Placeholder的数据类型和网络输入类型不匹配会导致此错误我在定义网络时的placeholder类型是tf.float32然而在传参时使用的类型是tf.int32. 因此产生了上述报错,解决办法是修改传入的参数数据类型。...原创 2021-03-01 23:07:45 · 491 阅读 · 0 评论 -
坑 之 TypeError: List of Tensors when single Tensor expected
我再使用tf.constant的时候出现了上述错误,经查阅资料发现。报错的原因:tf.constant传参时不可以是tensor,应该是numpy等类型的。这是一个小的问题,更正就好了例:a = tf.constant(1) #正确print(a) #正常输出b = tf.constant(a) #报错print(b) #报错...原创 2021-03-01 23:03:08 · 1372 阅读 · 0 评论 -
坑 之 Tensor XXX must be from the same graph as Tensor XXX
从报错信息上就能看出来我们的问题出在哪里,就是说我们的两个tensor来自两个不同的计算图,这样执行时自然会报错,那么是什么语原因呢?先看一下出错的代码:.......src = src_path + "/" + fileprint("start to process %s"%src)img = tf.read_file(src)img_org = tf.image.decode_jpeg(img)#----------------------------------------#tf.r原创 2020-12-24 17:14:34 · 2529 阅读 · 0 评论 -
坑 之 You must feed a value for placeholder tensor ‘label_input‘ with dtype float and shape
首先检查图中的tf.placeholder(),你在sess.run的时候是否feed满足dtype和shape的数据。如果你这两项都没错的话,那么你极有可能犯了重命名的错误,这里指的是使用占位符生成的变量和图中某个图操作节点的名称相同,也会报这个错误,例:pred = tf.placeholder(tf.int64, shape = None, name='img_input')gt = tf.placeholder(tf.int64, shape = None, name='label_inpu原创 2020-12-24 16:34:11 · 6849 阅读 · 11 评论 -
坑 之 使用numpy的tofile和fromfile读取数据
这里关于两种方法如何使用的博文已经很多了,具体用法可以参考这两篇博客:https://blog.csdn.net/kebu12345678/article/details/54837245和https://www.jb51.net/article/143411.htm这里我要讲的是我遇到的坑,就是我发现我读取的数据(shape=[321,321,1])和保存的数据(正常来说应该有321*321个元素)数据元素个数不一致,这是什么原因导致的?就是我在使用fromfile读取的时候未使用保存时的类型读..原创 2020-12-24 16:14:00 · 4400 阅读 · 1 评论 -
tensorflow.python.framework.errors_impl.InvalidArgumentError: slice index 0 of dimension 0 out of bo
tensorflow.python.framework.errors_impl.InvalidArgumentError: slice index 0 of dimension0 out of bounds. for 'strided_slice' (op: 'StridedSlice') with input shapes: [0], [1], [1], [1] and with computed input tensors: input[1] = <0>, input[2] = <原创 2020-12-22 13:14:29 · 890 阅读 · 0 评论 -
tf报错之raise TypeError(“pred must not be a Python bool“)
查阅资料发现原来是代码里定义的字符常量不是tf.bool类型错误出处:is_training = Falseresult = tf.cond( is_training, lambda: npu_ops.dropout(X, keep_prob), # tf.nn.dropout(X, keep_prob), lambda: tf.identity(X), name='dropout' )解决办法,将其定义为tf.bool原创 2020-12-07 11:46:30 · 1011 阅读 · 0 评论 -
tf报错 之 assertion failed: [Need value.shape >= size, got ] [336 210 3] [224 224 3]
根据信息提示,我们定位到了报错函数,函数原型:tf.image.random_crop(image,size,seed=None,name=None)产生这个问题的原因是:图片原来的 height或 width 要小于 你设置的裁剪值 的大小解决办法:1.将裁剪值调小,但如果你的数据集比较大的话,这种方法可能要用很多次,才能找到最合适的最小值2.先统一将图片resize成一个统一的大小,在进行裁剪,这样就方便不少resize函数:tf.image.resize(image,size)...原创 2020-12-05 15:59:15 · 459 阅读 · 0 评论 -
华为最新开源框架mindspore学习
最近的项目用到了mindspore框架,关于如何手把手在自己电脑上运行一个完整的例子,大家可以去官网中的教程中查看:https://www.mindspore.cn/tutorial/training/zh-CN/master/quick_start/quick_start.html你也可以直接跳过基础版,使用进阶版,如何利用华为载有Ascend(昇腾910,华为自研的人工智能芯片)的服务器上运行代码,大家按照这个例子来:https://www.mindspore.cn/tutorial/trainin原创 2020-11-18 23:59:14 · 2064 阅读 · 1 评论 -
记录 之 一个小bug:Unsupported syntax ‘Starred‘
Unsupported syntax 'Starred',翻译过来就是,不支持的语法“*”,这个时候你就要检查一下是不是自己哪里的*用错了原创 2020-11-18 20:36:29 · 298 阅读 · 0 评论 -
记录 之 整形数除整形数 产生的数据依然是整形,难搞哦
我的问题就是,我用整形数a去除另一个整形数b,产生的c = a / b ,这里是自动下取整的,所以有时候会产生不必要的错误。于是我,天真的这样用了即,c = float(a / b),这样是將下取整后的整形数转化为了float型,即0-> 0.0。依然有问题正确用法:1.c = float(a)/ b2.c = c * 1.0 / b当然还有许多其他办法,这里就列举这两个啦。另外,將一个整形数组转换为指定数据类型时,可以用.astype("xxxx")函数来实现。...原创 2020-11-17 00:22:31 · 731 阅读 · 0 评论 -
LeTax报错之 Incomplete \iffalse
因为\iffalse和\fi是一起使用的,可以用来注释某一段,所以,如果只使用了 \iffalse 而没有使用 \fi 的话,就会出现上述报错。原创 2020-09-05 19:34:23 · 3007 阅读 · 0 评论 -
Undefined control sequence. 问题
从网上下载的论文模板,我们在编译时的时候,总会遇到这样的报错,这里解释一下原因,这样出错的原因往往是由于缺包导致的,在使用的时候,要引入合适的包:常见的包有:\usepackage{amsfonts}\usepackage{amssymb}\usepackage{amsthm,amsmath}\usepackage{mathrsfs}\usepackage{indentfirst}\usepackage{multirow}等...原创 2020-09-05 19:18:30 · 15826 阅读 · 0 评论 -
使用Letax引用文献一直报错: LaTeX Error: Something‘s wrong--perhaps a missing \item
这个问题困扰了我好久,最近终于下决心解决这个问题了,(之前就是直接将出错部分注释掉,很暴力)。首先大家如果对letax如何引用文献有问题,可以参考这篇博文:https://blog.csdn.net/u011221336/article/details/52277632我使用的方法是,将引用与正文分开来写。使用方式就是:\begin{document} ...... \bibliographystyle{aaai} \bibliography{bibtex/ref}原创 2020-08-30 17:25:14 · 5111 阅读 · 0 评论 -
ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory出现这个问题的原因,主要是tensorflow-gpu版本和驱动cuda版本不一致所导致的,根据提示我们可以知道的是环境当前的tensorflow-gpu需要的cuda驱动为10.0,而当前环境的cuda版本低于10.0。解决方案:方案一: 第一步.明确自己的tensorflow-gpu版本,查找tensorflo.原创 2020-08-06 13:33:08 · 1472 阅读 · 0 评论 -
pip 指定路径安装工具包
命令如下:# 在dest_dir目标路径下,安装numpy包pip install -t dest_dir numpypip install --target dest_dir numpy原创 2020-08-04 14:42:16 · 261 阅读 · 0 评论 -
ubuntu 之 查看 cuda,cudnn版本
1.查看cudnn版本:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 22.查看cudnn版本则有很多种办法:①:nvidia-smi②:nvcc -V③:cat /usr/local/cuda/version.txt细心地同学会发现,有时①查看的cuda版本和②、③查出来的会不同,这是什么原因呢。原来cuda的API分为两种类型,一种是驱动(driver)API,另一种是运行(runtime)原创 2020-08-04 14:37:24 · 33467 阅读 · 9 评论 -
巨坑 之 pip install 和 conda install 的区别 以及 查看 和 修改 虚拟环境下运行路径
先来说明我的问题:首先我在anoconda下建立了自己的虚拟环境,并在我的虚拟环境中用pip安装了对应版本的tensorflow,但是再调用的时候,我发现并没有调用我安装的tensorflow版本。导致我的代码无法运行。因此我产生了一个疑惑,pip安装的包和conda安装的包的位置是否不同,我在运行的时候到底用的是那个环境下的包。注:miniconda3 和 我文中提到的anoconda3差不多,因为大部分是anoconda3,因此虽然机器上装的是miniconda3,但文章中在写的时候用的是anoco原创 2020-08-04 13:50:57 · 8625 阅读 · 5 评论 -
文件读写错误坑 之 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position
我们在使用open()来打开txt文件进行读写的时候,有时会产生这种报错,这通常是由于文件编码格式不一致导致的,因此我们在打开时要对文件加以编码限制:即#出错代码f = open('./test.txt','r')#加上编码限制后f = open('./test.txt','r',encoding = 'UTF-8')...原创 2020-07-28 23:09:12 · 6124 阅读 · 0 评论 -
pytorch 之 有关交叉熵函数使用的几点说明
1.函数原型:loss_func = nn.CrossEntropyLoss() loss = loss_func(pre_label, label)2.值得注意的点,这里的label不需要赋值one-hot编码类型,因为函数内部会自动将label变换为one-hot类型,如果这里赋值为one-hot编码,则会产生类似如下报错:①:RuntimeError: multi-target not supported at /opt/conda/conda-bld/...原创 2020-07-24 23:05:34 · 479 阅读 · 0 评论 -
pytorch 之 分开安装 torch 和 torchvision
本人在工作时遇到了一个比较尴尬的问题,就是虚拟环境中已有固定版本的torch,但没有安装torchvision,因此很本能的安装:pip install torchvision如果直接这样安装的话,我们发现会连带安装新版本的torch,由于不是本人的虚拟环境,不想改变别人的torch版本。因此该方法行不通。就在思考如何分开安装torch 和 torchvision,后来发现,只需下载较低版本的torchvision就可以解决我的问题。只要下载的版本大于0.3.x,就会下载更新torch。因此选择原创 2020-07-22 00:32:06 · 2360 阅读 · 0 评论