这个人很懒,还没有设置昵称...
我很懒,还没添加个人简介...
展开
-
安装mayavi
mayavi是一款可视化工具,知乎说直接pip install mayavi不好使,所以我就直接没试,我直接试的好使的。安装即可,直呼上说要按照步骤安装四个不同的包,但我安装mayavi的时候是自动把其他的依赖包安装好的。下载下来之后,放到桌面,然后打开anaconda prompt,下面的链接是一个各种依赖包的地址,点开进去之后找mayavi。如果以上不成功的话,请参考该。原创 2022-11-19 20:00:55 · 917 阅读 · 0 评论 -
随机种子np.random.seed()
1.第一个例子说的就是seed的生命周期,而第二个是比较重要的,举个例子,在seed设置一致的情况下,如果我们的项目代码内部连续调用了10次np.random,我们跑两次项目代码,生成的随机数都是一致的。如果我们想要拿到第6次np.random生成的随机数,就必须要依赖于前边的这5次np.random,才能够复现出第6次生成的随机数。以下情况np.random.choice,np.random.randint,np.random.permutation都适用。原创 2022-10-26 17:57:46 · 728 阅读 · 0 评论 -
ImportError: cannot import name ‘DtypeArg‘ from ‘pandas._typing‘ (lib/python3.8/site-packages/pandas
【代码】ImportError: cannot import name 'DtypeArg' from 'pandas._typing' (lib/python3.8/site-packages/pandas。原创 2022-10-03 10:47:24 · 1703 阅读 · 4 评论 -
FileNotFoundError: Provided FoldX directory foldx) is missing either rotabas.txt or foldx
下foldx4.0版本,里面就有rotabase.txt。原创 2022-08-27 00:31:03 · 263 阅读 · 0 评论 -
pip指定镜像源下载安装依赖包
这里的库名称可以是包名,也可以是本地版下载好的包,在安装过程中,会自动从指定的镜像源地址找到对应的依赖包。原创 2022-08-09 21:50:11 · 583 阅读 · 0 评论 -
{RuntimeError}Attempting to deserialize object on a CUDA device but torch.cuda.is_available() is Fal
根本原因:torch和cuda或者是cudnn版本不匹配详细教程可以参考我前边的文章https://blog.csdn.net/weixin_39417324/article/details/122090285原创 2022-05-12 00:22:16 · 1846 阅读 · 0 评论 -
python对两个list取交集、并集、和异或
第一种方法:使用python基本数据结构set集合。优点:集合运算长度可以不一致,运算效率高缺点:两个进行运算的集合中不能够含有重复的元素,如果含有的话,转成set集合后,会自动去掉重复元素a=[1,2,3]b=[1,2,6,9,12]print(set(a)&set(b)) #交集print(set(a)|set(b)) #并集print(set(a)^set(b)) #异或,就是两个集合去掉交集的那部分print(set(a)-set(b)) #差集,就原创 2022-04-10 14:17:24 · 9343 阅读 · 0 评论 -
计算氨基酸直径
求一个pdb文件中氨基酸的直径from rdkit.Chem import MolFromPDBFiledef get_amino_acid_radius(): root_path = r'chain_renumber' file_list = os.listdir(root_path) for name in file_list: pdb_path = os.path.join(root_path, name) decoy = MolFromPD原创 2022-01-12 00:22:09 · 282 阅读 · 0 评论 -
list中都是tensor型向量,最终将list整体转成tensor
import torchlist=[torch.ones((1,50)),torch.ones((1,50)),torch.ones((1,50))]list=torch.stack(list)原创 2022-02-25 10:21:12 · 3765 阅读 · 1 评论 -
matlib画图,plt.xticks设置x轴为文本形式,但是没有效果
将plt.xticks的函数放在画图的下面调用,例如sns的下面调用,放在上边有可能不好使def draw_picture(file_name,matirx): plt.cla() plt.figure(dpi=200, figsize=(8, 18)) sns.set() #plt.xlabel('feature', {'family': 'Verdana', 'weight': 'normal', 'size': 23, 'color': '#000000'})原创 2022-02-22 17:55:24 · 993 阅读 · 1 评论 -
umap代码实现
from sklearn.datasets import load_digitsimport matplotlib.pyplot as pltimport numpy as npimport umapdigits = load_digits()reducer = umap.UMAP(random_state=42)embedding = reducer.fit_transform(digits.data)plt.scatter(embedding[:, 0], embedding[:, 1],原创 2022-02-20 19:38:36 · 1572 阅读 · 0 评论 -
AttributeError: module ‘sklearn.datasets‘ has no attribute ‘samples_generator‘解决
这种错误很常见,一般看到是sklearn的包出现这种“啥啥模块或对象没有啥啥属性”问题,直接上网搜就可以,这个就是版本更新后,把这个sample_generator删掉了,直接这样调就可以:X, color = datasets.make_s_curve(2000, random_state=0)...原创 2022-02-19 14:29:52 · 2441 阅读 · 0 评论 -
验证时,所有的特征值经过模型后全为nan;特征值进入Lin全连接后,全部变为nan
前几天训练模型的时候,遇到了一个问题,就是特征值输入模型之前好好的,但是经过我的网络之后,输出的embedding全变成了nan。最让人无语的是,这是发生在验证阶段,而不是训练阶段!如果是验证阶段,就可以考虑一下是不是梯度爆炸的问题。但是发生在验证阶段,就很离谱了!而且,使用小部分测试数据的时候,模型居然一点问题都没有,当使用全部数据的时候,就不行了!当然,我尝试找数据集的问题,对数据集进行随机抽样,输进去其他不管是有规律还是没规律的测试数据集,都不好使,只要是准备真刀真枪的训练模型看效果了,哎,不好使原创 2022-02-14 20:26:23 · 3060 阅读 · 2 评论 -
python快速删除list中的重复元素;将整个list内元素进行类型转换;取交集、并集、交集;list取重复元素
以前删除重复元素,都是采用for循环去遍历的,或者是新建一个list,再去循环原来的list,如果新list中,没有这个元素,就给添加到新的list中。a=['a','b','c','a']a=set(a)#将list转成set集合,因为set集合不允许有重复元素存在,所以会自动删除a中重复元素a=list(a)#将删除完重复元素的set集合,强制转换成list,到此,删除重复元素就完成了在处理数据的时候,有时候需要对整个list内的元素进行强制类型转换。例如,将float都转成int,将str类原创 2022-01-07 21:08:03 · 800 阅读 · 0 评论 -
{RuntimeError}“nll_loss_forward_reduce_cuda_kernel_1d_index“ not implemented for ‘Float‘
应该是使用损失函数的时候,遇到了这个问题,意思就是说,这个函数的某个参数不支持Float类型的:F.nll_loss(out, target)这个函数就是算损失,一般来说,这个函数使用应该遵循下面两点:第一点,应该前后维度一致,如果你的batchsize大于1,那么可以都展开成为一维的第二点,out的类型是cuda类型的float,target是long()类型的F.nll_loss(out.squeeze().flatten(), target_class.flatten().long())原创 2021-12-27 01:59:15 · 8736 阅读 · 0 评论 -
NVIDIA GeForce RTX ***CUDA capability sm_86 is not compatible with the current PyTorch installation.
错误展示:NVIDIA GeForce RTX 3070 with CUDA capability sm_86 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_70.If you want to use the NVIDIA GeForce RTX 3070 GPU with PyTorc原创 2021-12-22 17:56:37 · 3269 阅读 · 0 评论 -
window linux安装cuda、anaconda、torch(快速搭建深度学习环境)
第一步,安装cuda。https://developer.nvidia.com/cuda-downloads从这个地址装cuda,我比较建议网络安装,安装的时候都选默认就可以。不用管啥啥版本对应啥啥anaconda的关系,因为我们后边可以通过装cudatoolkit选择对应的版本,也可以通过装虚拟环境自己设定环境的Python版本安装完后,打开命令行(开始菜单,输入cmd),输入下面命令,如果显示cuda版本了,就代表安装成功了nvcc -V可以看到下面cuda版本是11.5,这就代表安装成功原创 2021-12-22 17:43:27 · 4393 阅读 · 4 评论 -
Focal loss
focal loss原理:控制正负样本权重控制难易分类样本的权重公式说明:y就是实际标签p就是预测值CE(p,y)就是交叉熵参数说明:α就是你加的参数,也就是说,如果你把α设成0-0.5之间,你能够看到,其实是缩小了正样本的权重的,模型会重点去关注负样本α如果是0.5-1之间,那也就意味着你增加了正样本的权重,模型会重点关注正样本怎么设置:正样本少,负样本多,α就在0.5-1之间设控制难易分类样本的权重:γ:调制因子当pt的预测值比较低的时候,证明是模型难以识别这个样本,这原创 2021-11-22 16:01:11 · 1316 阅读 · 0 评论 -
PSSM本地版使用
https://www.cnblogs.com/cong3Z/p/12775414.html参考这篇博客,下载swissprot的时候不要下载错误,应该下载swissprot.gz,解压出来是一个swissprot文件,没有后缀原创 2021-11-03 16:44:23 · 307 阅读 · 0 评论 -
Post-condition Violation;Element ‘A‘ not found;Failed Expression: anum > -1;rdkit解析pdb报错;PeriodicTab
在使用rdkit解析pdb文件的时候遇到了一个问题,我是使用zdock生成的decoys集,里面的某个蛋白质的decoys数据集都有问题,找了半天,终于找到原因了。完整的错误是这样的:Post-condition ViolationElement ‘A’ not foundViolation occurred on line 91 in file /tmp/pip-req-build-tzcdahwp/build/temp.linux-x86_64-3.7/rdkit/rdkit/Code/Grap原创 2021-10-06 22:40:23 · 529 阅读 · 0 评论 -
Explicit valence for atom...is greater than permitted(NoneType object has no attribute GetConformers
我在使用rdkit解析pdb文件的时候,就遇到了这个问题,这个问题其实前人有好多遇到的,我在git上找到了相关原因,但是git上并没有给一个比较明确的解决办法,关于报这个错误的原因的就不解释了,大家想知道的点下面的连接:https://github.com/ReactionMechanismGenerator/RMG-Py/issues/1278git上不去的点下面的连接https://sourceforge.net/p/rdkit/mailman/message/23861634/错误代码:pd原创 2021-10-06 15:47:34 · 3563 阅读 · 1 评论 -
ubuntu安装cuda,和其他虚拟环境的相关细节
sudo apt-get remove cudasudo apt-get purge --auto-remove nvidia-cuda-toolkithttps://developer.nvidia.com/cuda-10.2-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=runfilelocal原创 2021-06-13 11:16:24 · 504 阅读 · 0 评论 -
python程序如何在加载的时候出现进度条
大家应该在用一些现有的python程序时候,会发现人家的程序还能在console控制台里面打印进度条,是不是很神奇?这是用了tqdm方法正常for循环写法:for i in list:进度条版:for i in tqdm(list):原创 2021-10-02 20:29:49 · 442 阅读 · 0 评论 -
读取json文件为dataframe后行列倒置的解决办法,以及dataframe基本操作(删除指定行、列,根据值筛选等)
今天写了个代码是读取json文件,但是,json文件读完后,行列倒置了,也就是说,列名成了行名,反而行的索引成为了列名,其实这个很简单,只需要加一个转置即可:df=df.T这个就可以把行名和列名倒置过来,回到原来的位置。说一下dataframe的基本操作:1、在原本dataframe的基础上追加新的dataframe。追加新的一条数据的话直接append一条含有对应值的 list就可以了df=df.append(new_df)注意,一定要有赋值操作,只append的话是不会改变df的值的,n原创 2021-09-29 20:37:37 · 782 阅读 · 0 评论 -
dataframe写入csv文件,to_csv()方法写入时列索引和列值错位问题
我们在使用dataframe写入csv文件的时候,可能会遇到错位的问题,当然,一般不会遇到,因为一般人都是正常碉包,我是纯手残,加了个参数,然后将dataframe写入csv文件的时候发生了列和列名错位的情况。大概就是所有的列名都挤到一块去了,然后每列的数据被分割,分成了好几列。一般将dataframe写入csv文件都会用到一个方法是df.to_csv()这里的df表示的是你要写入的dataframe的变量名to_csv()方法有很多参数,index=True,index_label等等,一共有原创 2021-09-29 20:19:04 · 7528 阅读 · 0 评论 -
读取CSV文件,并转换为dataframe格式,最后筛选数据
import osimport globimport pandas as pd#定义文件路径file_dir="./test.csv"#读取CSV 文件result_csv=pd.read_csv(file_path, error_bad_lines=False, encoding='gb18030',engine='python')#将结果转换成Dataframe格式的数据,Dataframe类似一个表格,columns代表表头的每一列的属性名,我们这里定义的是ABCD四列,注意,这里的A原创 2021-08-01 12:31:43 · 7021 阅读 · 0 评论 -
python 画折线图 并标记
首先安装plt相关的包,其实也就是画图相关的包,好像叫做Matplotlib 无所谓,安装包的命令行给你,直接粘,然后复制代码,直接跑就好pip install pytest-plt下面就是代码了import matplotlib.pyplot as pltx = [0,20,40,60,80,100,120,140,160,180,200]y = [0,2.3,4.5,6.5,8.5,9.9,10.9,11.9,12.5,12.9,13.4]x2 = [0,20,40,60,80,10原创 2021-03-27 20:36:50 · 8969 阅读 · 4 评论 -
matplotlib画图,应该是比较全的了
https://blog.csdn.net/qq_41140138/article/details/100980196?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_utm_term-1&spm=1001.2101.3001.4242转载 2021-03-27 16:30:30 · 71 阅读 · 0 评论 -
python正则表达式,组合使用
python 正则表达式,下面是例子,详细的解析在我上一篇博文里面有,这篇博文是写的组合使用的代码里面匹配XXX位置的话语不用管,这是pdb文件里面的数据格式,大家主要看后边的解析re_ATOM = re.compile(""" (ATOM[\s]{2}|HETATM) 匹配前六个位置,记录类型 (?P<serial>[\d\s]{5}) 匹配7-11个位置,一个数字,后面加上任意空白字符原创 2021-03-10 19:13:15 · 453 阅读 · 0 评论 -
python中compile函数
compile() 函数将一个字符串编译为字节代码group([group1, …]) 方法用于获得一个或多个分组匹配的字符串,当要获得整个匹配的子串时,可直接使用 group() 或 group(0)正则表达式正则表达式模式模式字符串使用特殊的语法来表示一个正则表达式:字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。多数字母和数字前加一个反斜杠时会拥有不同的含义。标点符号只有被转义时才匹配自身,否则它们表示特殊的含义。反斜杠本身需要使用反斜杠转义。由于正则表原创 2021-03-10 13:23:47 · 2713 阅读 · 0 评论 -
pycharm带参数运行(使用场景:命令行带参数调试代码)
有时候使用命令行直接运行.py文件的话就没法在pycharm里面运行debug,有时候在pycharm里面运行debug还没法带命令行的相关参数,那么就可以再pycharm里面设置带参数运行然后就可以直接debug run了,里面的参数会带进去跑的...原创 2021-03-09 20:16:26 · 3295 阅读 · 3 评论 -
Keras和TensorFlow的版本对应关系
Keras和TensorFlow的对应关系,下面网址应该是解释最全的了,希望对大家有帮助https://docs.floydhub.com/guides/environments/原创 2021-01-21 13:14:07 · 1199 阅读 · 0 评论