- 博客(24)
- 收藏
- 关注
原创 tensorboard使用
from tensorboardX import SummaryWriter#用 pytorch 自带的 tensorboard 也行# default `log_dir` is "runs" - we'll be more specific herewriter = SummaryWriter('logs')#在训练过程中,b为 iteration,e为epochif b%100 ==0: writer.add_scalar('image training loss',runnin.
2022-04-25 11:35:08 3299
原创 15/4/2022交叉熵损失函数和负对数似然损失
看论文,论文中写模型最后用的损失函数是交叉熵函数,但代码却是torch.nn.functional.nll_loss很是不理解,但后来看到一篇博客:[损失函数]——负对数似然 - 簡書 (jianshu.com)该文章对负对数似然函数进行了解释,有公式有代码,然后大彻大悟。这里的负对数似然损失就是交叉熵函数。负对数似然公式:[损失函数]——负对数似然 - 簡書 (jianshu.com)交叉熵公式:(4条消息) 交叉熵损失函数原理详解_Cigar丶的博客-CSDN博客_交叉熵损失函数.
2022-04-15 21:02:30 1598
翻译 论文笔记--Open-source platform to benchmark fingerprints for ligand-based virtual screening
写在前面: 之前写过一篇论文笔记,讲的是MoleculeNet,同样的,这篇论文也是一篇起到benchmark作用的论文,但针对的是不同指纹在分子相似性搜索方面的基准和综合。目前获取分子2D药效团的算法主要可以分为4类:(1)基于字典的;(2)基于拓扑或路径的;(3)圆形指纹;(4)药效团指纹。目前一些常用虚拟筛选(VS)的评价指标:(1)接收机工作特征(ROC)曲线下面积(AUC);(AUC对早期识别不够敏感)(2)在数据集的给定分数χ处的富集因子(EF);(EF依赖于ac
2022-04-15 11:31:06 286 1
原创 Transformer 好文章
原文:https://proceedings.neurips.cc/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf主要是探究 Layer normalization、warm up和梯度的关系。1603.05027.pdf (arxiv.org)1908.11365.pdf (arxiv.org)On Layer Normalization in the Transformer Architecture | Op...
2022-04-11 22:06:23 233
原创 11/4/2022代码问题不会就搜
1.data_dir = './DATA/rawdata'dataset_name = 'ted2020'prefix = Path(data_dir).absolute() / dataset_nameprefix.mkdir(parents=True, exist_ok=True)prefix是data_dir作为绝对路径,dataset_name是该路径下的一个文件名mkdir()的参数:(2条消息) Python3创建目录mkdir(parents=True, exist_ok
2022-04-11 22:01:00 867
原创 model.eval()和 with torch.no_grad() 在获取中间层特征时缺一不可
训练好神经网络模型后,我需要获取其中间层特征,但在通过复写模型的方法抽取特征的时候,vscode多次崩溃,并提醒我buy a new RAM!后来经排查发现,我只进行了 model.eval()操作,而没有在抽取中间层的时候加上 with torch.no_grad()。model.eval()仅作用于dropout层和batchnorm层,让其与训练状态不同,相当于dropout的参数为0,batchnorm也不再更新和计算mean和var值,而是使用训练阶段学习到的mean和var。而 wi
2022-04-06 10:58:36 1869 3
原创 tqdm bug
报错一大堆很吓人,但是又不影响运行:assertionerror: can only join a child process应该是tqdm的bug,我没有管他,程序也能正常运行,就是有点不好看有的博主说改进措施是:(1条消息) AssertionError: can only join a child process_南方Alan的博客-CSDN博客将fromtqdm.auto import tqdm替换为from tqdm import tqdm但是,我的程序本来就是后者,..
2022-03-31 09:31:40 563 1
原创 sklearn的t-SNE 三维散点图可视化
import numpy as npfrom sklearn.manifold import TSNEimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D#x是特征值,应该可以是array 可以是 dataframeX_tsne_t = TSNE(n_components=3,random_state=42,perplexity=30).fit_transform(x)#可视化fig = plt.
2022-03-26 19:54:28 3971 3
原创 报错分析:RuntimeError: DataLoader worker (pid(s) 9116, 18368, 20148, 15244, 12468, 17892, 10244, 21308)
调用 dataloader 时,报错:RuntimeError: DataLoader worker (pid(s) 9116, 18368, 20148, 15244, 12468, 17892, 10244, 21308)咱就是说是不是有可能内存太满了?重启内核你值得拥有~
2022-03-26 19:43:45 386
原创 26/3/2022代码技巧
1. tqdm可用于显示进度,但是当和enumerate同时使用时,它并不会显示进度条for b, data in tqdm(enumerate(data_loader)):结果是这样的:看到一个简单的解决措施:(11条消息) 当 tqdm 遇上 enumerate_Who is abc的博客-CSDN博客_enumerate tqdmfor b, data in enumerate(tqdm(data_loader)):...
2022-03-26 19:40:18 962
原创 25/3/2022代码技巧
1. del xxx(1) import xxx 的逆操作(2)释放内存,删除之前的一些缓存2. round()函数 用于四舍五入数值,起到取整的作用3. line.rstrip() 去除末尾空格 (也可去除其他字符)4. %tb 可查看报错的traceback...
2022-03-25 20:54:50 2233
原创 DLL load failed while importing rdBase
起初用rdkit没什么问题,后面安装了deepchem,就会报这个错,DLL load failed while importing rdBase可能是rdkit包受到了损坏,于是重新安装rdkit,就可以了但是吧,还是建议把deepchem单独安装在一个虚拟环境中,它会影响挺多以前安装的包,比如numpy啥的...
2022-03-24 17:24:50 1812 4
翻译 论文笔记--MoleculeNet
MoleculeNet: a benchmark for molecular machine learning - Chemical Science (RSC Publishing)摘要:MoleculeNet包含多个公共数据集,建立了评估度量,并提供多个先前提出的分子特征和学习算法的高质量开源实现(DeepChem库中)。此外,MoleculeNet benchmarks表明,可学习表示是分子机器学习的强大工具,并广泛提供最好的性能。然而,这个结果是需要注意的。在数据稀缺和高度不平衡的分类条件下,可学
2022-03-24 11:27:32 773
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人