各种报错
以前直接把解决方案收藏了,但是由于收藏夹太乱还得回头百度,这次我一定要一点一滴的积累起来,方便自己,造福他人。
Data_Designer
热衷于数据分析,大数据处理,机器学习等领域,天津大学,硕士学位,希望在编码和科研的过程中积累自己一点微不足道的经验,以后希望从事的工作方向为推荐系统和数据分析等领域,目前在网易伏羲Lab算法工程师实习。
展开
-
修改第三方源码
如果第三方库通过pip instal *或者conda install *安装,那么直接更改’…/site_packages/…’中相应的.py文件将不起作用(Python: how to edit an installed package?),这是因为使用pip安装库时已经自动编译了python代码,所以更改原始文件并没有改动编译内容。此时可以将该项目源码从GitHub中clone下来,更改源码,然后使用python setup.py build和python setup.py install手动安装。原创 2021-09-26 19:48:58 · 1048 阅读 · 0 评论 -
VSCode PowerShell 提示“无法加载文件,因为在此系统上禁止运行脚本”的解决方法
这主要是Windows自身设置Restrict模式。管理员身份打开PowerShell,然后执行set-executionpolicy remotesigned然后回答:Yes就行了。原创 2021-09-14 09:56:02 · 499 阅读 · 0 评论 -
RuntimeError: mat1 dim 1 must match mat2 dim 0
多半需要dataloader是drop_last=True原创 2021-07-18 09:20:11 · 411 阅读 · 0 评论 -
git每次输入密码
ssh-keygen -t rsa -C 'email.com'# 下面一路回车,不然每次都要输入密码然后再重新设置github中的ssh key。对了,以前用http提交的已经不能用了,可以再git文件夹里修改config文件原创 2021-07-17 09:06:07 · 153 阅读 · 0 评论 -
Dataloader的一些BUG
Broken PiP ERROR:参考RuntimeError: unable to open shared memory object </torch_3212_4199725757> in read-write mode:参考原创 2021-06-30 11:43:15 · 1393 阅读 · 0 评论 -
tensorboard显示多个曲线
tensorboard --logdir_spec=h1:runs01/,h2:runs02/ --port=6006 --bind_alll原创 2021-06-28 12:57:30 · 1377 阅读 · 0 评论 -
Pytorch分布式
nn.DataParallel的作用是将模型和数据分配到各个GPU上,让其在各自的GPU上训练。1. 首先检查batchsize是否是GPU数量的整数倍2. 以及dataloader是否设置了drop_last是否是true,如果没有drop_last,那么最后一个batchsize剩下的数量可能不是GPU数量的整数倍,会出现此错。3. 如果以上情况都不是报错原因,还有一个原因可能是:对模型进行传参时,有可能传递了标量。(!我就是这个原因无法进行训练,因为我每一个batch的都需要一组标量进行划原创 2021-06-25 10:00:08 · 266 阅读 · 0 评论 -
快速移动大量文件
mv比cp快的多,cp需要寻道多次原创 2021-06-24 09:30:29 · 532 阅读 · 0 评论 -
warning: LF will be replaced by CRLF in config/mem.sh.
往往出现在windows使用git提交linux开发机的代码时git config --global core.autocrlf false原创 2021-06-23 13:49:06 · 152 阅读 · 0 评论 -
pandas含有空列表
all the input arrays must have same number of dimensions, but the array at index 0 has 2 dimension(s) and the array at index 7 has 1 dimension(s) ('Lengths must match to compare', 'occurred at index trajs_1')出现以上两个错误多半是你的数据里含有空列表,可以考虑先替换为None或者0然..原创 2021-06-22 15:44:27 · 798 阅读 · 0 评论 -
/bin/bash^M: bad interpreter: No such file or directory
死活搞不好,其实是换行符的问题,检查文件格式(大多是windows写好传到linux的问题)1.cat -A filename,如果输出结果中行末尾是^M$,则是dos格式,如果行末尾只是$,则是unix格式。2.vim filename,编辑文件,执行“:set ff”,若执行结果为fileformat=dos则为dos格式,若执行结果为fileformat=unix则为unix格式。3.od -t x1 filename,以16进制查看文件,若输出结果中存在“0d 0a”则为dos格式,如..原创 2021-06-22 10:48:00 · 329 阅读 · 0 评论 -
If using all scalar values, you must pass an index
# 错误场景import pandas as pddict = {'a':1,'b':2,'c':3}data = pd.DataFrame(dict)import pandas as pd#方法一:直接在创建DataFrame时设置index即可dict = {'a':1,'b':2,'c':3}data = pd.DataFrame(dict,index=[0])print(data)#方法二:通过from_dict函数将value为标称变量的字典转换为DataFrame对.原创 2021-06-09 21:17:40 · 146 阅读 · 0 评论 -
missing operandTry ‘mkdir --help‘ for more information.
ubuntu系统版本问题mkdir -p "$system"原创 2021-05-30 19:15:18 · 3015 阅读 · 2 评论 -
SSH覆盖docker环境变量导致配置失效
https://www.cnblogs.com/xuxinkun/p/10531091.html原创 2021-05-28 17:52:53 · 363 阅读 · 0 评论 -
一次解决Pycharm服务器配置
第一步第二步注意:红框框那里使用which python # 查看conda配置的python解释器路径原创 2021-05-28 14:01:54 · 225 阅读 · 0 评论 -
ssh问题
ssh-service是否安装不是输入ssh有返回就行的service ssh status如果返回unrecongnized service原创 2021-05-28 11:23:29 · 131 阅读 · 0 评论 -
类别特征Embedding
输入数据是32*2,32个样本,2个类别特征,且类别特征的可能值是0到9之间(10个)。对这2个特征做one-hot的话,应该为32*20(multihot 编码),embedding就是使1个特征原本应该one-hot的10维变为3维(手动设定,也可以是其它),因为有2个类别特征这样输出的结果就应该是32*6model = Sequential()model.add(Embedding(10, 3, input_length=2))#构造输入数据input_array = np.random.ra原创 2021-05-27 10:44:21 · 861 阅读 · 0 评论 -
Pycharm统一换行符,防止脚本文件为CTRF
原创 2021-05-26 15:46:06 · 232 阅读 · 0 评论 -
torch非标量的反向传播
y = f(x) 人话就是y为scalar的时候可以对张量x求导,但是当y计算出来也是个标量的时候会报错import numpy as np import torch # f(x) = a*x**2 + b*x + cx = torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad = True) # x需要被求导a = torch.tensor(1.0)b = torch.tensor(-2.0)c = torch.tensor(1.0)原创 2021-05-10 19:34:41 · 581 阅读 · 0 评论 -
from_numpy其实和numpy指向同一个地址
#torch.from_numpy函数从numpy数组得到Tensorarr = np.zeros(3)tensor = torch.from_numpy(arr)print("before add 1:")print(arr)print(tensor)print("\nafter add 1:")np.add(arr,1, out = arr) #给 arr增加1,tensor也随之改变print(arr)print(tensor)# 可以用clone() 方法拷贝张量,中断.原创 2021-05-10 19:17:04 · 251 阅读 · 0 评论 -
DANN困扰解决-交替训练数据
zhen原创 2021-04-27 21:12:07 · 582 阅读 · 0 评论 -
Git冲突-心态爆炸
今天给git搞得心态爆炸真的,不行就换个新文件夹重新搞吧,不然太乱了。git clone ssh # 下载# 直接删除掉想替换的部分git rm XXX# 新增想加入的东西git add# 然后重新提交git commitgit push -u origin master...原创 2021-04-17 17:17:22 · 117 阅读 · 0 评论 -
TypeError: unhashable type: ‘numpy.ndarray‘
别想了,多半是你传值的地方传了个列表,如下i = [0,1,2,3]item[i] = 1原创 2021-03-19 23:27:11 · 2376 阅读 · 2 评论 -
Pycharm Bug
建好工程以后想从benchmark中导入settings中的包,死活就是导不进去,应该是source package的设置问题,留在这等解答。原创 2021-02-28 13:54:02 · 152 阅读 · 0 评论 -
日期错误TimeStamp
ds_ends = get_date_lista(begin_date='2020-11-01',end_date='2020-11-31') 一直在报错!后面发现11月没有31号,所以一直无法转换!原创 2021-02-28 12:21:24 · 664 阅读 · 0 评论 -
Tensorboard
原创 2021-02-24 22:40:08 · 150 阅读 · 0 评论 -
全局变量的BUG
在Main函数书写列表,即可以在train函数中直接进行调用,而创建Tensor却不行!(本意想的是train中借用main函数中定义的全局Tensor进行concat)有一个好的做法就是Main中创建为列表,然后在train函数中对列表进行extend。...原创 2021-02-21 22:40:06 · 165 阅读 · 0 评论 -
RuntimeError: CUDA error: device-side assert triggered
CrossEntropy使用的Label中存在-1!!!!原创 2021-02-07 21:20:32 · 236 阅读 · 0 评论 -
NLLoss和交叉熵的坑
不要试图把你的类分为-1,0,1三种,切记!原创 2021-02-07 20:59:45 · 715 阅读 · 1 评论 -
terminate called after throwing an instance of ‘c10::Error‘
今天服务器开发的时候报错,需要把pth的保存路径换成绝对路径,不然upload上服务器会报错!原创 2021-02-04 17:49:58 · 841 阅读 · 0 评论 -
DGL安装报错OSError: libcublas.so.10: cannot open shared object file: No such file or directory
重新安装pip:pip upgrade重新安装cuda:conda install -c anaconda cudatoolkit=10.1原创 2021-02-04 15:49:27 · 1619 阅读 · 2 评论 -
Cuda Error 700 内存非法访问问题
网上看了一圈,说什么调整batchsize啥的,设置多卡啥的,根本不起作用,建议使用torch1.2查一下你是不是to(device)漏了,比如我在transformer Encoder时候忘记把Position编码的参数to(device)了,再torch1.2中就会直接报错,而在torch1.6的版本就会出现上述的错误,死活搞不定!所以可以有个torch1.2的版本搞定了model,再使用torch1.6重新运行,这样不但能使用tensorboard(torch1.2的board不能显示图形),奇怪的错原创 2021-01-22 10:36:55 · 5474 阅读 · 0 评论 -
Hive查询出现表名问题
set hive.resultset.use.unique.column.names=false;在Hue和Hive Cli中均可以调用该命令,注意Hue中需要从Impala窗口切换到Hive窗口。别问为啥查询比Impala慢,就是慢!!!原创 2021-01-21 21:42:50 · 613 阅读 · 0 评论 -
Pytorch的报错
1. 在model中万万不能出现下面这个语句for i in range(3): model = Net() lis.append(Net())return lis这样Torch会报错!!!血的教训解决办法:第一:nn.ModuleList第二,老老实实一个个model的写2. 不要用Pytorch1.2的tensorboard,就是不显示,别问为什么。3.RuntimeError: one of the variables needed for gradi.原创 2021-01-16 18:09:32 · 1471 阅读 · 1 评论 -
NotFoundError: Could not find valid device for node. Node:{{node Softmax}} All kernels registered fo
报错:NotFoundError: Could not find valid device for node.Node:{{node Softmax}}All kernels registered for op Softmax :解决办法:使用numpy,将激活函数的输入改成float 64,运行正常,同理,使用其他激活函数,例如relu,softmax, tanh,selu,sigmoid等激活函数,都应该保证输入是float。...原创 2021-01-01 20:19:56 · 713 阅读 · 0 评论 -
Windows1909更新的一个大坑
winver查看当前windows版本及其内核-更新后截图如下真的,直接使用安装包进行下载,不要去一个劲的按检查更新了!!!原创 2020-10-10 22:29:10 · 606 阅读 · 0 评论 -
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any()
这个错误是在做数学建模比赛中遇到的一个pandas数据处理的任务。简单理解就是你使用一个数和多个值或一个列表中的值相比较、匹配。解决示例代码如下:a = tempData[colName[i]].values.tolist()[0]b = target_data133[colName[i]].values.tolist()[0]简单来说就是你把它提取出来转化为列表进行操作即可。...原创 2020-09-22 10:51:37 · 449 阅读 · 0 评论 -
TypeError: Fail to find the dnn implementation.
本质原因应该是GPU内存不够。解决办法如下1. 设置GPU自增长# 设置gpu内存自增长,注意加在import之后,不然会报如下错误# RuntimeError: Physical devices cannot be modified after being initializedgpus = tf.config.experimental.list_physical_devices('GPU')print(gpus)for gpu in gpus: tf.config.experi原创 2020-08-22 15:26:42 · 548 阅读 · 0 评论 -
Keras无法下载imdb数据集
直接到官网下载,放到Keras文件夹下面一般的默认路径如下:C:\Users\Administrator\.keras\datasets下载地址,下载完直接保存到上面的默认路径即可:https://s3.amazonaws.com/text-datasets/imdb.npz原创 2020-08-12 10:10:25 · 575 阅读 · 0 评论 -
FailedPreconditionError:: 2 root error(s) found.
由于Tensorflow版本不一致的问题导致Estimator有很多坑!!!问题代码如下# 预定义estimator使用output_dir = 'baseline_model'if not os.path.exists(output_dir): os.mkdir(output_dir)# tensorflow版本有问题,需要改!!!baseline_estimator = tf.estimator.BaselineClassifier(model_dir=output_dir,原创 2020-08-07 09:58:28 · 1371 阅读 · 0 评论