自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (2)
  • 收藏
  • 关注

原创 Could not build wheels for XXX, which is required to install pyproject.toml-based projects

解决方法:直接pip install pymatgen就行了。一般是装某个需要pymatgen的包会碰到这个问题。不要装pymatgen的老版本,还会报这个错。

2024-06-20 05:10:49 248

原创 解决 RuntimeError: CUDA error: device-side assert triggered

debug方法就是逐行插入print看在哪tensor的值输出不出来,问题就定位到了。如果是自定义的loss,可以换个loss之类的再试试。但这个报错烦人的点是它不告诉你哪有问题,而且报错的行往往不是真正有问题的行,很多时候是有问题行的下一行。如谷歌搜索结果所述,这种情况多半是loss计算出了点问题。

2024-06-01 20:21:47 123

原创 PyTorch训练网络参数不更新原因一例

起因是在训练一个多个模块构成的网络时发现loss不收敛,而且是所有的子loss都不收敛,显然这就不是因为个别loss写错导致的了。但模块A确实在前向传播中被调用了,那原因是什么呢?发现模块A的参数梯度值竟然都是None!其次,检查模块各个参数是否都设成。删除多余的嵌套后,问题解决!首先,有一个地方用了。

2024-05-19 01:06:15 256

原创 怎么用pymatgen将超胞复原成原胞

有时出于一些原因,需要将pymatgen超胞(super cell)复原为primitive cell。注意,如果改成用get_reduced_structure()是没有效果的,原因不明。

2024-04-18 05:42:01 170

原创 解决AttributeError: Can‘t pickle local object ‘ALIGNN.__init__.<locals>.<lambda>‘

这是因为没有在pytorch中设置ddp (distributed data parallel) 就试图使用多块GPU。如果调试阶段不想用ddp,显式把使用的GPU数量设成1即可。

2024-04-03 21:50:52 135

原创 PyXtal计算两个晶体的XRD之间的相似度

晶体的XRD是计算值,不是实测值。

2024-03-26 01:39:46 142

原创 【别折腾显卡驱动了】ImportError: libcudart.so.10.2: cannot open shared object file: No such file or directory

笔者的DL项目,在本地 PC (cuda 11.2)上运行良好,在服务器 (cuda 11.8)上报上面的错。排查发现,如果把DL项目里的模块B换成原作者使用的模块A,则运行顺利。单独运行模块B发现,问题出在模块B使用了dgl上(划重点:这个具体的报错信息在运行完整项目的时候会被吞掉,系统只会告诉你libcudart.so.10.2,不会告诉你是在import dgl上出的问题)。卸载dgl,重新安装cuda 11.8版本的dgl后,问题解决!别再费时费力地往cuda目录里加文件了!

2024-01-15 18:57:54 1053

原创 解决 ReduceLROnPlateau conditioned on metric val_loss which is not available

其实可能是模型在跑第一个验证样本时推理出了问题导致退出或者返回None之类的,所以val_loss不计算

2024-01-07 05:09:16 472

原创 深度学习配环境三板斧:升级、降级、备份

常常发生这样的情况:要安装包C,结果conda或pip自动把包A和包B需要的一些早期版本的依赖升级了,导致本来跑得好好的环境四处起火,修了这个问题又会出现下一个问题,程序完全跑不起来,让人非常头疼。那好,看起来是pymatgen引用了monty里一个不存在的东西,有可能是pymatgen太新monty太老,或者monty太新pymatgen太老。百度Google也找不到什么经验帖可以参考啊!也就是说,看到这种输出你要立刻明白一个非常简单的道理:可能是monty的问题或者是pymatgen的问题。

2024-01-06 07:14:22 493

原创 最新的不等于最好的--从segmentation fault说开去

这就造成了即使按照 environment.yml 来配置环境,如果作者没有细致地写清每一个包的版本,那么由于时间推移,就有可能导致一些包被自动安装了与其他包冲突的最新版,从而使得代码无法运行。这时,通过观察故障包的名称,安装相应的旧版可能会解决问题。一方面,负责开发 Linux 发行版的团队构成互不相同,而它本身也不是一个盈利的项目,这些年来围绕开发产生的各种狗血剧情也是数不胜数,这势必造成版本的质量控制无法同 Windows 相比,指望他们对用户负责只能呵呵呵。

2024-01-02 00:31:36 351

原创 解决Ubuntu改用户名后conda找不到路径

先说原因:~/anaconda3/bin/文件夹里面的conda, pip等文件头还是老用户名。把pip和conda文件头部蓝色字体部分(称作shebang line)里的老用户名换成新的。作死改了Ubuntu系统的用户名,结果输入conda找不到了。

2023-12-31 01:56:33 486 2

原创 解决Linux系统中已安装conda却找不到命令

这是因为没有设置环境变量告诉系统conda在哪。只需要在.bashrc文件中加一行。如果装的是miniconda就把上面的anaconda3换掉。

2023-12-28 19:34:05 1524

原创 RuntimeError: Found dtype Double but expected Float - PyTorch

在使用Pytorch Lightning训练时在backward阶段输出了“RuntimeError: Found dtype Double but expected Float”错误。最后查明,在使用mse时,必须将输入参数手动转为float,算完mse再用float()就会报上面的错——即使输出这个loss的dtype它依然显示是float32类型。一开始,尝试把所有loss在return之前都用.float()方式转为float32,但问题依然存在。

2023-11-16 21:51:16 1385 1

原创 将计算节点设置为VS Code远程Python解释器

能不能直接用交互式计算节点作为本地IDE的Python远程解释器,实现cuda相关代码的实时调试呢?

2023-04-20 23:16:59 320 1

原创 将Google Colab用作PyCharm远程解释器(2023年4月)

原则上是不可行的

2023-04-11 23:46:02 2092 3

原创 Outlook邮箱网页版无法记住登录状态

结果发现之后每次登录outlook邮箱网页版(实际是学校的邮箱,outlook.office.com或outlook.office365.com)都会要求重新发短信或使用Microsoft Authenticator验证。但如果关闭掉整个浏览器窗口(即把chrome.exe从RAM中清出去),则session立即失效,再次打开邮箱需要登录验证。反复确认过浏览器没有打开退出清cookie的选项。Chrome和Edge浏览器均有此问题,自己电脑其他账号也没这问题,所以不是客户端设置的原因。

2023-04-09 21:29:01 809

原创 有密码Win10创建新用户

3)开机狂按F2/F12/Del进入启动选项,U盘引导。PE系统启动后进入桌面,打开U盘里的Windows Login Unlocker,新建用户即可。1)先用老毛桃WinPE做一个USB启动盘(注意文件系统格式要跟U盘格式化的格式一致,比如都是ExtFAT)对此,显然最佳选择是在不破坏师兄密码的情况下新建一个Windows管理员账户。2)再把Windows Login Unlocker拷到U盘里。(其实微PE也可以,但微PE在英文系统下会乱码,遂弃之)但师兄电脑有密码,他自己也忘了。

2023-02-21 07:13:30 1362

原创 用Android手机充当台式电脑的摄像头、麦克风和音箱

DroidCam:起摄像头和麦克风的作用。AudioRelay:起输出音频的作用。

2023-01-09 23:04:31 3251

原创 解决explorer.exe开机占用CPU过高

Windows 10 explorer.exe每次开机都占用50%CPU左右,笔记本风扇狂转解决策略:使用procexp程序(微软自家出品的任务管理器升级版)看explorer.exe的哪个线程这么占发现是一个叫tpreleasecleanupgroupmembers的东西谷歌一下发现这玩意是Microsoft Store Installation (MSI),不知道为啥就开始呼呼往我机子上装在services.msc里停止掉就可以了,去它的吧参见:https://docs.microsoft.

2022-04-07 09:06:20 4305 1

原创 Python Matplotlib如何更改图例字体

在互联网上容易搜到大批垃圾为防止以后不好找在此记录一下font1 = {‘family’ : ‘Times New Roman’,‘weight’ : ‘normal’,‘size’ : 15,}plt.legend(prop=font1)就可以了

2022-03-23 10:21:44 4861 1

原创 如何在IEEE论文模板中使用algorithm

IEEE论文模板对algorithm的支持很差(官方不推荐使用)尝试使用网络上一些所谓“可用”的代码后,LaTeX常常会在\end{algorithmics}处报错以下代码亲测可用,主要是使用\bf命令模拟关键词黑体显示效果,以及用\hspace命令控制缩进\begin{algorithm}[htbp] \caption{xxxx} \hspace*{0.02in} {\bf Input:} learning rate $\alpha$\\ %\begin{algor

2022-02-14 10:57:28 1387

原创 I found no \bibdata command 解决方法

用VS Code加载IEEE的LaTeX模板会报错:I found no \bibdata command解决方法就是在.tex文件的\end{document}前面加两句\bibliographystyle{IEEEtran}\bibliography{IEEEexample}这时再编译又会报错Something's wrong--perhaps a missing \item.这是因为正文中没有任何一个参考文献的引用。解决方法就是先加一个参考文献或者在正文任意位置插入语句\cite

2022-02-05 09:03:13 11950 3

原创 深度学习模型tensor维度对不上怎么办

深度学习模型tensor维度对不上是一个非常常见且有时比较难排查的现象。之所以难排查是因为报错信息和真实的错误原因之间的联系往往并不紧密,很难仅仅从PyTorch给出的数字上的信息判断错误在何处。笔者在一个训练好的模型上测试单个样本时出现了这个问题,一度排查了图片读取、图片通道数等问题,最后发现原因在于forward部分的代码是针对batch编写的,所以输入的格式是四维的BxCxHxW,而测试单个样本时输入是三维的,所以只需要一行img=img.unsqueeze(0)就解决了这个浪费了一上午 + 一下午

2021-11-30 17:25:58 4945 2

原创 Process finished with exit code 143

跑一个深度学习模型第一次运行出现Process finished with exit code 137之后再运行均出现Process finished with exit code 143137是内存不够,143没有查到。然而使用free -m命令查看服务器明明还有40多个G内存最后解决的办法也很玄学,重启两次笔记本电脑就莫名其妙好了(怀疑是PyCharm的bug,垃圾IDE)...

2021-11-30 13:28:16 5297 1

原创 torch找不到函数可能是torchvision的问题

用别人的代码有时会出现torch.xxx找不到xxx函数的问题这不一定是PyTorch的版本不对,也可能是TorchVision的版本不对,按照作者给出的配置安装这俩即可。

2021-11-26 09:57:29 3186

原创 深度学习配环境加速手段

以torchvision为例,conda install torchvision 如果一直卡在Solving environment转圈,可以改用pip install torchvision -i https://pypi.tuna.tsinghua.edu.cn/simple这种指定安装来源的方式安装。

2021-11-25 21:05:47 711

原创 内网Ubuntu服务器环境配置

问题背景有一台只能上内网的Ubuntu服务器和一台同一网络环境下能访问公网的Windows笔记本电脑。现需要给服务器进行深度学习环境配置。方案考虑方案1:给服务器配置代理,通过笔记本访问公网。方案2:在其他电脑上用conda的虚拟容器配好环境,再拷贝到服务器上这两种方案都是可行的。方案1可以使用对新手友好的CCProxy软件,使用时要注意“本机局域网地址”应该使用在Windows网络属性里面看到的IPv4地址,而非VMWare虚拟机的网络地址。同时“设置”界面第一行“HTTP/RTSP”最后的I

2021-11-25 15:05:42 1115

原创 WebBrowser后台自动填表问题

问题描述使用WebBrowser在Winform最小化到托盘状态下自动填写表单,结果这一过程不能全自动进行,在某一步时必须把窗口置于前台(或者弹出MessageBox)才能继续自动过程。解决方案可能有效的方法1:在需要弹框的步骤处加Thread.Sleep(1000);可能有效的方法2:需要弹出时,将窗口设为全透明弹出,弹出后再改回去。...

2020-03-29 11:32:39 165

原创 CEF浏览器最小化到系统托盘后线程退出的解决方法

问题描述编写基于Winform的CEF浏览器,当程序最小化到系统托盘后,浏览器线程自动退出。此时再调用Load()方法会引发错误。解决方案使用DefWndProc()方法拦截最小化事件,当点击最小化时不最小化,而是令form1.Visible=false,问题解决。...

2020-03-29 11:25:45 2660 2

原创 Visual Studio 2019配置OpenCV 4.1.1常见问题

初次配置步骤参考这篇文章:link常见问题无法打开opencv_world343.lib在“属性管理器”——“Release x64”——右键属性——链接器——输入——附加依赖项中,把"opencv_world343.lib"改为“opencv_world411.lib”即可。include <opencv/cv.h> 报错这是因为OpenCV 4.1.1 版没有opencv...

2019-10-06 11:24:23 458

原创 UVA 160 Factors and Factorials

又是大水题,照着做就行了#include <stdio.h>double readline(){ int count; scanf("%d", &count); int num[1000] = { 0 }; int i = 0; for (int b = 0; b < count; b++) { scanf("%d", &num[i]);...

2019-06-21 21:52:26 127

原创 UVA Online Judge 382 - Perfection

这里写自定义目录标题送分题,照着要求做就行了#include <stdio.h>#include<math.h>int nums[100];int perfect[100];void output(){ printf("PERFECTION OUTPUT\n"); for (int i = 0; i < 100; i++) { if (num...

2019-06-19 20:21:00 199

电脑版微信群消息屏蔽器

彻底屏蔽微信群消息,把你讨厌却又不得不留在里面的微信群连根拔起。开启屏蔽后,电脑上完全看不见听不到该群聊的任何消息提示,包括“@所有人”!同时,手机端该群的所有消息也是已读状态。

2020-05-06

jmfjmfjmfjmfjmjf

jmfjmfjmfjmfjmfjmfjmfjmfjmfjmfjmfjmf

2009-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除