自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 收藏
  • 关注

原创 PyTorch常见报错汇总

Pytorch常见报错汇总

2022-09-26 16:37:42 1623 1

原创 Python pandas 缺失/空值判断与处理

1.相关概念空值:在pandas中的空值是""缺失值:在dataframe中为nan或者naT(缺失时间),在series中为none或者nan即可2.判断文件中是否含有缺失/空值#首先读入文件df = pd.read_csv("nba.csv") # 查看每一列是否有NaN:df.isnull().any(axis=0)# 查看每一行是否有NaN:df.isnull().any(axis=1)# 查看所有数据中是否有NaN最快的,没有输出False,反之为True:df.isnul

2022-04-17 16:30:08 16261

原创 KD Tree原理讲解

1.引子在一张地图上,有600多个单位,每个单位之间都需要独立寻路,检测碰撞和寻找最近的敌方目标。当这一切需要在手机上流畅运行并尽可能快的在服务器进行模拟时,最简单的平方算法O(N^2)已经不能满足需求。怎样减少计算的复杂度呢?通过观察,可以发现,在地图左上角的单位根本无需和地图右下角的单位进行碰撞检测,因为它们离的太远了。所以,通过对战场进行空间划分,可以避免大量的无效计算。一种简单的划分方法是,将战场沿着横纵坐标划分为N * N的格子,只对在相同格子内的战斗单元做碰撞检测。

2022-04-15 15:34:47 1347

原创 VS Code安装更新失败解决方案

今天在使用VS Code时发现修改代码后软件进行了自动更新。结果就爆出了更新失败的错误提示,点击确认后软件自行删除了。错误提示如下图所示:大致意思就是找不到code.exe查找了一下相关资料,有的说是之前下载的vscode有好几个版本,删除就好了。尝试了一下发现并不能解决问题。最终排查出的问题大概是安装VSCode时将其安装到了D盘,更新时它还是自动寻求C盘的更新文件进行更新。解决方法:找到C盘中的更新文件手动安装一下即可。我的文件路径在于:C:\Users\coast\AppData.

2022-04-15 14:23:59 2972 1

原创 量化经济学:手把手教你如何使用EXCEL分析股票历史数据

1.数据来源获取数据集的下载来源为Yahoo Finance。Yahoo Finance是雅虎公司金融媒体领域的一个相关网站。它提供财经新闻、数据和评论,包括股票报价、新闻稿、财务报告和原创内容。它还提供了一些用于个人财务管理的在线工具。除了发布来自其他网站的合作伙伴内容外,它还发布其员工记者团队的原创故事。在最大的新闻和媒体网站列表中,它被 SimilarWeb 排名第 21 位。其上能便捷的查阅各大公司的历史股价变化数据,兼具权威性与方便性,因此我们将其作为我们数据获取的来源。网站的具体使用如下图所

2022-04-14 10:14:08 7944

原创 2022年第十三届蓝桥杯研究生Python组题目分享

1.比赛过程总结因为众所周知的缘故,今年蓝桥杯很多地方改成了线上。暴力圈钱杯变成了厕所抄袭杯...不过实际情况比我想象中要好一点点。填空题由五道改成了两道,大题变成了八道。一定程度上减少了一些抄袭情况,当然完全避免肯定还是不可能的...考前模拟时系统崩溃了,很担心考试时再出现这种情况,不过还好正式比赛时并没有出现这种情况。但是还是要吐槽几点:1.参赛题目解压密码一开始始终解压不了文件,心态直接有点崩溃。直到开考八分钟后才解压成功,也不知道是什么问题...期间还特意下了一个新的解压软件。2.监

2022-04-09 18:08:28 13371 10

原创 使用VScode连接远程服务器的配置方法

参考文章:https://zhuanlan.zhihu.com/p/1412052621.安装VScode官网地址:https://code.visualstudio.com/2.安装OpenSSH该服务的作用是让你可以在终端使用ssh指令,Windows10通常自带OpenSSH不需要安装。Windows10下检查是否已经安装OpenSSH的方法:按下快捷键Win + X,选择Windows PoweShell(管理员),输入以下指令:Get-WindowsCapability -Onli

2022-03-30 19:10:14 10200

原创 几何量和物理量改善E(3)等变信息传递

来源:ICLR2022作者:Johannes Brandstetter, Rob Hesselink, Elise van der Pol, Erik J Bekkers, Max WellingJohannes Brandstetter, Rob Hesselink, Elise van der Pol, Erik J Bekkers, Max Welling参考链接:https://cloud.tencent.com/developer/article/1919990代码:https://gith

2022-03-30 10:35:36 602

原创 解决 vscode “调试设置中的 Python 路径无效”的问题

1.问题window刚安装的vscode,配置完环境还可以正常跑python。突然不知为何就报这个错:调试设置中的 Python 路径无效cmd下python可以正常运行,所以推断必然是vscode出的问题。针对该问题vscode和python插件已经重新安装过,仍然无效,网上也有说修改python的Default Interpreter path:如果你通过修改这里,将其设为本机的python运行程序exe文件,可以修复问题就不用往下看了。我是修改后也没有用,于是考虑是vscode的配置有问

2022-03-30 10:21:27 2880

原创 python 生成英文字母对应顺序字典

#生成大写字母dict_A = {chr(i): (i-65) for i in range(65, 91)}#生成小写字母dict_a = {chr(i): (i-97) for i in range(97, 123)}print(dict_A)print(dict_a)结果为:

2022-03-27 15:10:42 1936

原创 AutoDockFR:具有明确指定结合位点灵活性的蛋白质-配体对接研究进展

微信公众号参考链接:链接引用原文:Ravindranath, Pradeep Anand et al. “AutoDockFR: Advances in Protein-Ligand Docking with Explicitly Specified Binding Site Flexibility.” PLoS computational biology vol. 11,12 e1004586. 2 Dec. 2015, doi:10.1371/journal.pcbi.1004586https://

2022-03-24 20:22:57 2949

原创 Python datetime库的基本使用

1.库的导入 from datetime import datetime 2.获取当前日期和时间now=datetime.now()print(now)3.获得指定日期和时间dt=datetime(2022,3,17,14,0)print(dt)4.str转换为datetimecday = datetime.strptime('2022-03-17 13:56:35', '%Y-%m-%d %H:%M:%S')print(cday)5.datetime转换为strno

2022-03-17 14:11:06 1210

原创 如何在Jupyter中安装Python第三方库

在jupyter notebook中直接输入:!pip install [库名]例如安装imageio库,命令为:!pip install imageio结果为:

2022-03-16 08:44:01 14370 2

原创 如何在windows上安装RISC-V GNU工具链

安装WSL :1.在“管理员模式”下打开“PowerShell”按下组合键Windows + R以打开运行窗口。输入powershell然后按下回车键。Windows PowerShell会以当前用户的权限去执行。如果你想要从普通模式转至管理员模式,输入以下PowerShell命令然后按下回车键Start-Process powershell -Verb runAs2.在打开的界面中输入命令:wsl --install注意:有些机器需要运行“wsl–install-d Ubuntu”

2022-03-14 10:49:16 2514 1

原创 解决使用python sort语句排序的时候输出的是none

为什么使用pyhon sort的语句,排序后却输出none?很简单,在排序的时候,是不允许做其他的处理的举一个简单的例子s=[1,3,44,5.,8,2]print(s.sort())以上的写法都是输出none那么要怎么样修正呢?要单独把排序作为一个语句就像这样s=[1,3,44,5.,8,2]s.sort()print(s)最终输出的就是正常结果了...

2022-03-08 11:23:50 1908

原创 蓝桥杯刷题记录——翻硬币

题目描述:小明正在玩一个“翻硬币”的游戏。桌上放着排成一排的若干硬币。我们用 * 表示正面,用 o 表示反面(是小写字母,不是零)。比如,可能情形是:如果同时翻转左边的两个硬币,则变为:oooo***oooo现在小明的问题是:如果已知了初始状态和要达到的目标状态,每次只能同时翻转相邻的两个硬币,那么对特定的局面,最少要翻动多少次呢?我们约定:把翻动相邻的两个硬币叫做一步操作。输入:两行等长的字符串,分别表示初始状态和要达到的目标状态。每行的长度< 1000输出:一个整数,表

2022-03-07 19:52:45 147

原创 三维分子图的球面信息传递

参考链接:微信公众号文章摘要:我们考虑3D分子图的表示学习,其中每个原子与3D中的空间位置相关。这是一个探索不足的研究领域,目前缺乏一个有原则的消息传递框架。在这项工作中,我们在球坐标系(SCS)中进行分析,以完全识别三维图形结构。基于这些观察,我们提出了球形消息传递(SMP)作为一种新颖而强大的3D分子学习方案。SMP极大地降低了训练的复杂性,使其能够在大规模分子上高效执行。此外,SMP能够区分几乎所有的分子结构,未发现的情况在实践中可能并不存在。基于对三维信息有意义的物理表示,我们进一步提出了用于三

2022-03-07 16:00:41 3688

原创 蓝桥杯——Python组刷题记录——03

01-——DNA题目描述:小强从小就喜欢生命科学,他总是好奇花草鸟兽从哪里来的。终于, 小强上中学了,接触到了神圣的名词–DNA.它有一个双螺旋的结构。这让一根筋的小强抓破头皮,“要是能画出来就好了” 小强喊道。现在就请你帮助他吧输入:输入包含多组测试数据。第一个整数N(N<=15),N表示组数,每组数据包含两个整数a,b。a表示一个单位的DNA串的行数,a为奇数且 3<=a<=39。b表示重复度(1<=b<=20)。输出:输出DNA的形状,每组输出间有一空行。样

2022-03-06 12:00:34 227

原创 蓝桥杯——Python组刷题记录——02

01——Tom数题目描述:正整数的各位数字之和被Tom称为Tom数。求输入数(<2^32)的Tom数!输入:每行一个整数(<2^32).输出:每行一个输出,对应该数的各位数之和.样例输入:123455612382样例输出:151710解题思路:while(True): a=input() sum=0 for i in a: sum+=int(i) print(sum)02——蓝桥杯2013年第四届真题-买不到的数目题目描

2022-03-06 11:49:54 185

原创 蓝桥杯——Python组刷题记录——01

01-蓝桥杯历届试题-最大子阵题目描述:给定一个n*m的矩阵A,求A中的一个非空子矩阵,使这个子矩阵中的元素和最大。其中,A的子矩阵指在A中行和列均连续的一块。样例说明取最后一列,和为10。输入:输入的第一行包含两个整数n, m,分别表示矩阵A的行数和列数。接下来n行,每行m个整数,表示矩阵A。数据规模和约定对于100%的数据,1< =n, m< =500,A中每个元素的绝对值不超过5000。输出:输出一行,包含一个整数,表示A中最大的子矩阵中的元素和。样例输入:3

2022-03-06 11:38:22 245

原创 2021华为杯数学建模获奖经验分享

前言本科时就很遗憾没能参加什么竞赛,到了研究生阶段想弥补一下本科阶段的缺失,刚好学校组织了华为杯数学建模的比赛,没什么经验的我就报名参加了,没想到最终获得了国二,虽然和那些拿国一的大佬还是比不了,不过对于我个人来说已经很满意了。下面分享一下整个的准备过程。赛前准备招募队友阶段是数模竞赛过程中非常重要的一个环节,遇到负责任厉害的队友整个建模过程就会很轻松,获奖几率也会大很多,如果队友是那种混子,很可能最后建模编代码写论文都是你来弄,他什么都不帮忙,你累死累活也很难拿到奖,比赛过程中身边有的队伍就是这样,

2021-12-13 14:29:45 3623 5

原创 三维图形网络的球形消息传递

《Spherical Message Passing for 3D Graph Networks》会议:iCLR摘要:我们考虑从3D图中的表示学习,其中每个节点与3D中的空间位置相关联。这是一个探索不足的研究领域,目前缺乏一个原则框架。在这项工作中,我们提出了一个通用框架,称为三维图形网络(3DGN),为三维图形提供不同粒度级别的统一接口。在3DGN的基础上,我们提出了球面消息传递(SMP)作为在球面坐标系(SCS)中实现3DGN框架的一种新颖而具体的方案。我们进行了形式化分析,并表明在SMP方案中,三

2021-12-09 20:30:50 1698 2

原创 如何系统学习机器学习?

第一部分:机器学习基础篇第一章:自然语言处理概述自然语言处理的现状与前景自然语言处理应用自然语言处理经典任务第二章:数据结构与算法基础时间复杂度、空间复杂度动态规划贪心算法各种排序算法第三章:分类与逻辑回归逻辑回归最大似然估计优化与梯度下降法随机梯度下降法第四章:模型泛化与调参理解过拟合、防止过拟合L1与L2正则交叉验证正则与MAP估计第二部分:文本处理篇第五章:文本预处理与表示各类分词算法词的标准化拼写纠错、停用词独热编码表示tf-idf与相似度分布式

2021-12-09 19:21:43 131

原创 李沐-斯坦福《实用机器学习》-02章

1.探索性数据分析导入相关包numpy:python中做数据分析常用的包;pandas:也是用于数据分析,擅长处理表,数据没那么大要放入内存中,这将是首选;matplotlib.pyplot:源自matlab的画图工具;seaborn:基于matplotlib,提供更多的画法剩下两行用于将图片设成svg文件(画起来分辨率相对高一点)读取数据csv文件存下来相对比较大,可以先压缩成一个zip或一个tar,主流的读取文件都可以从压缩文件中读取。建议存成压缩文件,在传输存储都会比较好,甚至还会比

2021-11-29 17:44:02 1547 2

原创 李沐-斯坦福《实用机器学习》-01章

1.课程介绍视频链接首先介绍了机器学习作为技术本身,它的大致构成以及所面临的一些挑战.然后讲述学习机器学习,你会变成什么样的角色.最后讲述了本课程中会涉及到哪些主题.举例:房价预测问题工业界中应用机器学习的基本流程机器学习的应用是一个循环过程.他从问题表述开始到收集数据建立模型并将模型上线.上线之后要对模型不停的监测并重复更新模型.问题—收集处理数据—训练调参—部署到线上/观测模型调整挑战:Problem formulation首先是将实际问题换一种描述方式,表述成机器学

2021-11-29 11:20:14 2758

原创 药物发现综述-04-反应与合成预测

01.反应和合成预测02.梅根:分子编辑图注意网络03.最大似然估计训练04.一种用于逆合成预测的图对图框架05.06.反应中心预测07.图形翻译08.实验09.超越二维图形到三维结构10.一致性预测11.传统方法12.机器学习方法13.一个两阶段的方法14.通过双层优化实现端到端的求解15.基于梯度场学习的力场预测16.17.挑战:3D旋转等效变形18.我们的解决方案:通过链规则进行梯度传播19.训练20.21.例子22.

2021-11-25 21:30:59 271

原创 药物发现综述-03-分子设计与优化

01.分子设计与优化02.新药设计与优化03.两个不同的任务04.目标导向分子优化05.VAE连接树06.VAE连接树07.寻找具有最优性质的分子08.GraphAF:一种基于流的分子图生成自回归模型09.一种基于流的分子图生成自回归模型10.GraphAF的优势11.分子生成12.定向目标分子生成加强学习13.分子优化14.约束优化15.MoFlow16.总结...

2021-11-25 21:14:35 498

原创 药物发现综述-02-分子性质预测

01-分子性质预测2.神经消息传递网络3.消息传递的阶段4.读取函数5.自监督学习6.图神经网络的预训练策略7.图神经网络的预训练策略8.信息图:无监督的整个图表示学习9.信息图:无监督的整体图形表示学习10.半监督的图表示学习11.半监督的图表示学习12.总结...

2021-11-25 20:57:50 2683 2

原创 药物发现综述-01-药物发现概述

1.演讲者介绍唐健目前是蒙特勒尔学习算法研究所(Mila)的助理教授,该研究所专注于深度学习和强化学习,由图灵奖得主Yoshua Bengio领导,从2017年12月开始。他的研究重点是图形表示学习、图形神经网络、药物发现和知识图。他被提名为第一批加拿大CIFAR人工智能主席(CIFAR AI研究主席)。他是密歇根大学和卡内基梅隆大学的研究员。他曾在微软亚洲研究院担任研究员两年。他获得了ICML’14的最佳论文奖和WWW’16的最佳论文提名。王菲现任康奈尔大学威尔康奈尔医学院人口健康科学系健康信息学副

2021-11-25 20:43:38 1304 3

原创 有监督、无监督与半监督学习

有监督学习:训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。无监督学习(unsupervised learning):训练样本的标记信息未知,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础,此类学习任务中研究最多、应用最广的是"聚类" (clustering),其他无监督算法还有:密度估计(densityestimation)、异常检测(anomaly det

2021-11-24 09:17:36 621

原创 基于可学习尺寸自适应分子亚结构的药物相互作用预测

来源:https://doi.org/10.1093/bib/bbab441源代码:https://github.com/kanz76/GMPNN-CS摘要:药物-药物相互作用(DDI)是指当两种或两种以上不相容药物同时服用时,对身体产生不良影响的相互作用。它们可能是由所涉及药物的化学成分引起的。我们介绍了门控信息传递神经网络(GMPNN),这是一种信息传递神经网络,它从药物的分子图表示中学习具有不同大小和形状的化学子结构,用于预测一对药物之间的DDI。在GMPNN中,边被视为控制消息传递流的门,因此以

2021-11-17 14:40:12 1710

原创 Transformer论文逐段精读

原文详细解读视频:https://www.bilibili.com/video/BV1pu411o7BE笔记: https://www.bilibili.com/read/cv13759416spm_id_from=333.788.b_636f6d6d656e74.47另一个模型讲解视频bilibili.com/video/BV1Di4y1c7Zmp=2&spm_id_from=pageDriver

2021-11-12 13:54:02 527

转载 如何理解 Transformer 中的 Query、Key 与 Value

------------------------------------- 转载:原作者yafee123 ------------------------------------- Transformer 起源于 2017 年的一篇 google brain 的又一篇神文 《Attention is all you need》,至此由引领了在 NLP 和 CV 了又一研究热点。 在 Transformer ...

2021-11-07 08:26:15 3344

原创 如何阅读一篇论文

参考链接:https://www.bilibili.com/video/BV1H44y1t75x?share_source=copy_web1.title2.abstract3.introduction4.method5.experiments6.conclusion第一遍:标题、摘要、结论。可以看一看方法和实验部分重要的图和表。这样可以花费十几分钟时间了解到论文是否适合你的研究方向。第二遍:确定论文值得读之后,可以快速的把整个论文过一遍,不需要知道所有的细节,需要了解重要的图和表,知道每一

2021-11-05 15:04:01 73

原创 零基础多图详解图神经网络

参考链接:https://www.bilibili.com/video/BV1iT4y1d7zPspm_id_from=333.999.0.01.前言:主要内容:构建一个图神经网络需要哪些模块,背后的思想是什么图的上一层的结点是由图的下一层的邻居结点构成的图形无处不在。研究人员已经开发了对图形数据进行操作的神经网络(称为图形神经网络,或GNN)十多年了。最近的发展提高了他们的能力和表达能力。我们开始在抗菌发现、物理模拟、假新闻检测、流量预测和推荐系统等领域看到实际应用。(图神经网络才刚刚开始应用)

2021-11-05 14:36:45 1628

翻译 LMSOC:一种对社会敏感的预训练方法

文献地址:https://arxiv.org/pdf/2110.10319.pdf本文将社会语境(感觉有点像世界知识)考虑到了NLP的模型之中,基于时间和地理位置两个社会语境构建了数据集与基线对比,在MRR上的改进超过了100%。模型的实现非常简单,只是将社会语境信息用图的方法进行嵌入,然后将其简单粗暴地加到了BERT的输入中。...

2021-11-01 10:45:59 88

原创 自监督学习与药物发现

原文参考链接药物发现是图神经网络一个比较成功的应用。本文研究分子图的自监督表示学习,并且取了一个很响亮的名字,GraphMVP。本文的主要思路是在3D几何信息帮助下预训练一个2D拓扑编码器,然后进行下游任务的微调。1.引入使用机器学习方法来进行药物发现的两大挑战:1.如何为分子图设计一个公共的潜在空间(即设计一个合适的编码器)2.如何构造一个目标函数来监督训练(即定义一个学习目标)本论文属于第二类:利用三维几何和二维拓扑之间的一致性来研究自我监督的分子表征学习。分子性质可以通过3D几何更好地预

2021-10-28 09:34:27 925

原创 彻底弄懂408——数据结构中Next与Nextval数组的求取问题

本文只讲如何求解字符串的Next与Nextval数组,和如何利用这两个数组,至于为什么这样求解不做过多解释,也没有必要花很多时间去了解。掌握选择题的解题思路即可,代码部分不是特别重要1.KMP算法简介朴素模式匹配算法在字符串对比失败后,主串指针会回溯到之前开始位置的下一位,继续进行对比,回溯导致了字符串对比的时间复杂度很高,接近O(n^2)。KMP的主要思想是避免主串回溯,当发生对比失败时,移动模式串对比指针的位置而保持主串的对比指针不动,从之前对比失败的位置继续对比(特别的:当模式串首位发生对比失

2021-10-19 09:26:02 4523 2

原创 Python:根据Excel中的数据生成heatmap热力图

1.heatmap 热力图热力图在实际中常用于展示一组变量的相关系数矩阵,在展示列联表的数据分布上也有较大的用途,通过热力图我们可以非常直观地感受到数值大小的差异状况。本文采用seaborn 来进行生成.2.数据集展示本文读取的文件类型为Excel表格,大小为20*20的矩阵,具体内容如下:3.代码展示// An highlighted blockimport matplotlib.pyplot as pltimport seaborn as snsimport pandas as pd

2021-10-18 20:07:02 5179 2

原创 Python:使用拉依达准则(3σ准则)剔除excel表中异常数据

1.简介拉依达准侧(Pau’ta Criteron)是先假设一组数据中只含有随机误差,首先按照一定准侧计算标准偏差,按照一定概率确定一定区间,认为不在这个区间的为异常值。当数据呈正太分布或者近似正太分布时可以使用2.数据集示例3.完整处理代码import numpy as npimport pandas as pd#设置需读取文件的路径datapath = "traning处理前.xlsx"data = pd.read_excel(datapath)# 记录方差大于3倍的值#shape

2021-10-18 19:44:20 6476

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除