自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(522)
  • 资源 (15)
  • 问答 (9)
  • 收藏
  • 关注

原创 使用Python的subprocess执行另外一个python文件(应用之一是Pytorch中如何让多个不同的模型同时/并行进行训练)

p1和p2这两个进程谁先执行完毕是未知的。使用wait之后,我们会等待这两个进程都执行完毕之后再执行主程序。上面这样执行另外一个python程序,其实我们并没有关心那个程序什么时候运行结束。所以,如果helloworld.py需要额外传入参数才能运行,可以在那个列表。上面只调用了一个外部文件执行,我们可以多调用几个,这几个程序是并行执行的!运行结束后会输出一些结果,这些结果是主程序需要的。的文件,在主程序如下运行即可。这样的话,后面的程序就会等待。运行结束才能往下运行,因为。运行结束后再运行,没有。

2024-09-23 12:21:57 232

原创 使用多进程(torch.)multiprocessing来并行运行多个不同的模型

但是其实,下面这个代码并不完美,因为只支持CPU,不支持在GPU上运行。不是说我没有GPU,而是下面这个代码放到GPU上运行会报错,我也不知道怎么改。

2024-09-23 09:11:26 52

原创 (已解决)ValueError initializing torch.distributed using env:// rendezvous: environment variable MASTE

而且还使用了以下这些东西。这个错误是在使用多进程。

2024-09-22 10:36:48 113

原创 (已解决)AttributeError: Can‘t get attribute ‘train‘ on <module ‘__main__‘ (built-in)>

别人说的方案二:在import时,把multiprocessing模块替换成multiprocess模块即可(需要在环境中先pip安装multiprocess模块)。这个错误是在jupyter notebook等交互类python时,当时在使用多进程。,所以把代码放在pycharm或者vscode中运行就好了,比较推荐。好像不一定会报这个错误,只是我遇到了,错误原因我也没有摸清楚。封装的是multiprocessing模块。遇到这个问题,而是使用python内置的。时遇到标题的问题,方案二可能有用。

2024-09-22 10:30:49 172

原创 一次使用threading.Thread来实现Pytorch多个模型并发运行的失败案例

我有多个pytorch GPU模型,他们有不同的参数(也就是说不是共享的),但是相同的数据输入,想要并发运行。以上速度就有点受不了了。我看过了,我的GPU还有很多空间,起码放上去10个模型没有问题。结果就是不起效果好像,还是运行得很慢,咋回事捏。不并发运行,当然就是循环喽。

2024-09-22 09:38:38 356

原创 (已解决)vscode如何选择python解释器

有的时候可能有不同版本的编译器,以适用不同年份的项目。所以,怎么在vscode中换python解释器呢?

2024-09-19 19:27:04 526

原创 Anaconda3-2021.11-Linux-x86_64.sh: line 399: TMP: unbound variable

一般大家是不会遇到这个问题的。我这是因为服务器的驱动程序太老了,所以必须换老版本的Anaconda,然后在安装的时候就出现了文章标题的报错。

2024-09-19 18:52:45 240

原创 (已解决)vscode如何传入argparse参数来调试/运行python程序

以前,我都是用Pycharm专业版的,由于其好像在外网的时候,不能够通过VPN来连接内网服务器,我就改用了vscode。改用了之后,遇到一个问题,调试或者运行python程序的时候,怎么给程序传入参数。通常,很多python项目都会用argparse这个包来统一管理程序运行时所需要的参数,#结果是默认值5现在问题来了,我们想要设置num_epochs这个参数为7,看一下程序运行效果好不好,怎么办?有人说,我直接vscode底部开一个命令行终端,传入这个参数不就行了吗?

2024-09-18 17:21:53 561

原创 2024年jupyter notebook如何复制单元格cell输出的图片

之前使用jupyter notebook复制图片一直是正常,右键就行,可以找到复制图片或者另存为的选项。但是最近重新安装了anaconda,发现jupyter notebook升级了,和原来的界面不一样了。我是使用的笔记本电脑,windows10,谷歌浏览器,如下方案可以行得通。按照ctrl+shift键,然后再右键图片,可以弹出以前的选项框。发现没有复制图片的选项。

2024-07-23 22:03:36 611

原创 (已解决)Adobe Flash Player已不再受支持

一般来说,很少遇到官方网站使用Adobe Flash Player来进行录用名单公示了。但是,今天就偏偏遇到一次,用谷歌浏览器打不开,点了没有反应,用其他的浏览器,例如windows自带的那个microsoft edge浏览器,也不行,和上面一样。用手机的浏览器也不行,甚至上面那个图标文字都不会显示,一片空白,什么也没有。

2024-06-29 10:55:21 2731 2

原创 (完全解决)Python字典dict如何由键key索引转化为点.dot索引

这个时候嵌套字典行不行呢?也就是字典里的某一个值又是一个字典,不行!

2024-05-25 23:09:24 419

原创 PackagesNotFoundError: The package ml_collections are not available from current channels

看到有人的项目里面用了ml_collections这个包,基本功能好像是在机器学习领域配置超参数,我虽然不爱用这种包,但项目用了,我也没办法,先下载了一下。去anaconda官网查了一下,压根没有这个包ml_collections,这个包是谷歌私人开发的,所以要去github下载源文件,然后pip安装。但是下面三个命令都失败了。

2024-05-23 11:52:07 268

原创 IEEE PDF eXpress Validating Pdf..之后Error in converting file

至于说转好后的格式有啥不同,我看了一眼,第一:那个超链接没有了,就是那个引用的索引,我原本的pdf点击索引就可以跳转到reference,被他转了之后不行了,我问了那个人工,他说是这样的,没问题。第二:图片变暗淡了一些些,我原本的图片统一使用的pdf图片格式,非常亮,比较清楚,他转了之后难道不是了?解决办法如下:失败之后,那里有一个选项按钮,叫做manual request,也就是人工转换,点那个申请就可以了,然后也挺快的,我个人是1个小时候之后就人工给我转好了。

2024-04-21 20:34:19 800 4

原创 自然语言处理基础面试

​ bert的Embedding层由3个子层求和得到,分别是词向量层Token Embedings,句子层Segment Embeddings以及位置编码层Position Embeddings,特别注意的是,bert中的位置编码层是采用随机初始化训练学习得到,和transformer的正弦函数编码不同。原始bert是静态mask,也就是每个epoch训练的内容mask部分都是一致的,这样没法学习到更多有用的信息,roberta采用的是动态mask,每个epoch训练的mask都是重新处理的,效果更好。

2024-04-20 23:38:32 436

原创 大模型(e.g., ChatGPT)里面的一些技术和发展方向

具体来说,再训练一个模型C,这个模型学习如何给一个(问题,答案)打分,至于说给多少分,也是需要人类标注数据的,人类需要标注(问题,答案,打分),也就是说一个问题可能会有多个答案,好的不好的答案都有,但打分不同,这个模型C训练好了之后,就可以用来监督模型D了。在模型A的基础上,输入一个问题,模型A会输出一个答案,这个答案和问题一起交给模型C,我们可以得到一个得分,这个得分会反馈给模型A,从而模型A不断学习,想要提高得分,得到模型D。有监督微调,也就是给定问题和答案,对1中学习的预训练模型进行微调。

2024-04-20 11:24:04 1160

原创 arxiv文章导出的bibtex格式是misc导致latex引用不正确

在arxiv官网上右下角导出bibtex,发现是misc格式,然后我用的是springer的期刊latex模板,发现引用不正确。有3个地方要改,一个是misc换成article,一个是添加了最后两行,然后就是正常的arxiv文章引用格式了。把上面那个bibtex手动改成下面这个。引用效果如下,就只有一个2024。

2024-04-15 12:03:28 602 1

原创 IJCNN注册(register)的时候付款失败(the payment didn‘t process)

主要是这个name on card,不是填你的论文英文名字,也不是填银行卡上那个MR.中文名字拼音,而是填你的中文名字!就是注册这张VISA卡的时候的中文名,踩坑了!又要踩坑了,我当时是在北京办理的工行星座卡,所以我写了Beijing, 不行!琢磨了一下,不是前面的填写信息有问题,而是付款信息的问题。上面这三个没有什么好说的,都是数字,银行卡上面全部写了。然后是那个国家选择,老实选择中国就行。坑了我好久,试了好多遍。

2024-04-13 20:33:32 273

原创 (已解决)使用IEEE格式的latex模板时出现引用(citation/reference)下面有下划线的情况

翻译一下就是:正常情况下,引用的期刊或者会议都是斜体的,而不是像之前那样有一个下划线。出现下划线的原因就在于导入了奇怪的包。问题如下,1.有一个下划线标注所发表的期刊或者会议2.不是斜体的。我们可以使用其他命令,这样就不用导入。上面这样肯定是不对的,那为什么会出现这种情况呢?仍为斜体,那么引用格式就不会异常了。,斜体命令此时会变成下划线命令。1.使用删除线,好像并不是只有。,这可以使得你可以继续使用。

2024-04-08 11:35:57 844 1

原创 Healthcare医疗健康领域常见的几个单词

在美国,医学界将23小时内出院的手术病例,界定为日间手术。因此人们在美国经常能看到名字里带有“23”这个数字的日间手术中心,医生们还会将23这个数字印得大大的,放在自己的名片上面。这里要注意的是,虽然有的“日间手术”的英文名称里有“Outpatient”这样的字眼,但日间手术与我们所熟知的“门诊手术”是截然不同的,两者的区别在于:门诊手术一般不需要麻醉医生在场,例如医生自己动手麻醉的大隐静脉、肿块切除等手术;而“日间手术”是需要麻醉医生参与的,和日常手术室里的那些大手术没有什么区别。

2024-04-07 23:02:10 365

原创 What is case-based reasoning (CBR)? 基于案例的推理

有人说,不知道名字有啥的,反正大家都会用,不需要学它叫什么名字。话虽如此,但是如果你说你的这种技术大有来头,等到你汇报给别人听的时候,或者写论文的时候,别人就会觉得你的东西逼格高,而不是干巴巴的说,我们提出了一个方法,这个方法非常直觉。这个方向其实挺小众的,然后其实也很直觉,所以你可能其实一直在用这个技术,只不过你不知道这个技术有一个专业的名字《基于案例的推理》而已。

2024-03-24 11:56:00 635

原创 include和contain的区别

参考:https://www.bilibili.com/video/BV1Nv411Y7is/?A包括B,其实A和B是同一种东西,比如人包括大人和小孩,这次参观包括对博物馆和游泳馆的参观(前后都是参观),这些都使用include。个人的解释,这两个东西都有包括,包含的意思,但是也正如其名,include侧重包括,contain侧重包含。

2024-03-15 16:32:52 316

原创 (已解决)将overleaf上的文章paper上传到arxiv上遇到的问题。

首先说一点,将paper的pdf文件直接上传arxiv是不行的,arxiv要求我们要上传源文件,所以才这么麻烦。

2024-02-11 21:09:27 1753

原创 (已解决)LaTeX Error: File `svproc.cls‘ not found. (用Springer LNCS 会议Proceedings模板)

解决办法:我们发现其实是路径不对,所以我们更改一下路径就好了,然后发现编译成功。

2024-02-10 22:08:54 1265 1

原创 Universal Approximation Capabilities of Mixture of Weibulls (混合韦布尔分布的万能近似)

回答1:Ultimately this sounds tautological: just define “well-behaved” as any density that can be approximated, according to some specific metric, arbitrarily closely by mixtures of Weibulls!找了好久都没有找到混合韦布尔分布是否有万能近似性质,下面这个算是一点线索,不过看不太懂。

2024-01-24 18:02:48 436

原创 (统计用词)Identifiability可识别性

比如我现在有一个正态分布,只有我知道他的均值和方差,然后我根据这个正态分布采样无数个点,让另外一个人根据这些采样的点来推断正态分布背后的均值和方差。在无数个点的情况下,这个人应该得到。也就是说不能有另外一个均值和方差竟然可以和我们这一个均值和方差采样到一模一样的无数的点。这里的model你可理解为就是一个分布,比如正态分布,其有两个参数。且正确的均值和方差。正态分布是可识别的。

2024-01-24 17:49:45 580

原创 Pytorch如何使用RNN而不是RNNCell进行单步(迭代,递归)更新

一种方法当然是用回RNNCell,但是之前训练模型的时候用的是RNN,不方便换回去重新训练RNNCell,现在想在RNN基础上加一个递归的功能。后来直接使用RNN了,可以输入多个位置的输入,直接得到最后一个位置的隐状态。以前初学的时候是使用的RNNCell,是用来迭代的,接收的是两个参数,一个是当前位置输入,一个是之前隐状态,然后就更新得到新的状态。得到的结果的含义,前面已经说了,我们现在的任务是,能不能利用RNN递归地得到上述结果呢?结果如下,可以看到,和之前的结果一模一样。注:初始化的隐状态是0。

2024-01-19 17:25:11 440

原创 (已解决)word如何制作和引用参考文献

1.有人会问,我能不能复制那个引用[1],然后改成[2],然后就变成引用第2篇文章,这个格式上来说是可以,但是我好像试过,这样的话,点击那个[2]只会跳转到第一篇文章,也就是说你改成2,但是超链接其实是没有改的,所以最好不要这样复制,就光标位置继续插入引用就好了,也很快的。这个时候,我们发现会弹出一个对话框,这些就是之前编过号的参考文献,你可以选择一个参考文献,然后点击插入,表示要在光标处引用它,然后就完成了。如下,先选中,然后点击编号,然后选择编号的样式,一般都是[1]的这种形式。

2024-01-02 11:48:59 1754

原创 (已解决)Critical Package ctex Error: CTeX fontset `fandol‘ is unavailable in current

其实解决的办法很简单,我这里说使用overleaf的情况(如果你是本地安装那10几个G,本地运行latex的,建议你改用overleaf,真的好用,到时候你会谢我的。首先,这个错误会产生,说明你是想用ctex这个包,也就是需要写入中文,但是编译的时候报了上述的错误对吧。2.将编译器选成xelatex,原本英文的话应该会是pdflatex。网上很多人给了解决办法,但是在我这都没有用。3.重新编译,成功。

2024-01-02 09:49:39 5295 4

原创 (已解决)(pytorch指定了gpu但还是占用了一点0号gpu)以及错误(cuDNN error: CUDNN_STATUS_INTERNAL_ERROR)

前者报错我的理解是当使用CUDA的时候Pytorch内部有一个初始化,默认运行在第0块GPU(即使模型被指定运行在其他GPU),然后显存不足指的是在初始化的时候显存不足,也就是第0块GPU显存不足以支撑初始化了,一般初始化其实并不消耗多少显存,比模型运行时一般小多了,那为什么还会报错呢?:仅有5号gpu可见,此时gpu编号会改变,5号gpu会变成0号gpu,所以指定0号gpu,其实就是指定原来的5号gpu。我们其实就是要解决Pytorch指定了gpu但还是会占用了一点0号gpu(初始化默认会在0上面)。

2023-12-29 11:56:15 2815

原创 (salutation称呼)Mr., Mrs., Miss, Ms., Mx.,Jr.,Sr.,II,III,IV 分别是什么意思

Mx.:在性别方面,常见的英文称谓主要有Mr. (先生)、Mrs. (太太)、Miss(小姐)及Ms.(女士)等。这个词的出现显然和时代发展有关,我们知道,人是分男女的,几乎各行各业都遵守,有些人就觉得没有必要,都是人,所以就有那种无性别论的人,如果出国,可能会见到。Sir:也是先生,可以直接称呼一个不知姓名的男士,作为对比Mr. 后要加姓,Miss其实也可以用于直接称呼一个不知姓名的女士。Miss:小姐(未婚),但不严格,有的时候学生称呼女老师可以直接用这个词,不必管是否结婚。Mrs.:太太(已婚)

2023-12-24 10:14:34 5684

原创 (已解决)如何使用matplotlib绘制小提琴图

绘制小提琴图,本人暂时不想学新的东西,就是懒。本文介绍如何使用matplotlib绘制小提琴图,很多其他博客只是使用最简单的语法,默认小提琴颜色会是蓝色,根本改不了。本文使用了一点高级的用法,可以满足基本日常需求。想要更加高级怎么办?

2023-12-18 23:07:57 803

原创 (已解决)set_ticks() got an unexpected keyword argument ‘labels‘

这个玩意是Matplotlib 3.1及以上版本的用法,而你的版本低于这个版本,不支持。方法1:更新你的Matplotlib版本。这里给两种方法,个人推荐方法2。上述代码的功能和新版本的。

2023-12-18 22:22:54 1097

原创 在linux环境下使用命令行运行python项目时包(模块Module)以及文件路径的问题

由于个人一直习惯就是使用绝对路径,所以以前一般比较少碰到标题所示的问题。这次遇到一个项目,其全部使用的是相对路径,然后我在linux环境下运行。是一个绝对路径,所以你进入linux之后,可以在任何工作目录执行上述命令。其次,如果项目文件中导入包是相对路径(这个一般都是),例如假设我们的。但是,如果这个项目里面有代码使用相对路径,例如代码要打开文件。提醒python如果找不到包可以在上述目录下寻找。,那么就有可能报错。不报错的情况是,你需要在。那么如上还是可能会报错,即没有模型名字叫做。

2023-11-03 21:58:56 1088

原创 (完全解决)如何输入一个图的邻接矩阵(每两个点的亲密度矩阵affinity),然后使用sklearn进行谱聚类

网上倒是有一些关于使用sklearn进行谱聚类的教程,但是这些教程的输入都是一些点的集合,然后根据谱聚类的原理,其会每两个点计算一次亲密度(可以认为两个点距离越大,亲密度越小),假设一共有N个点,那么就是。参数其实就是距离计算公式你选用哪个的意思,比如我们常常知道的欧式距离,曼哈顿距离,当然谱聚类里面不是这些。总之,实际使用中,哪个效果好用哪个,建议官方提供的距离你都可以试一试。然后算法再根据这些亲密度进行聚类,即亲密度越大的点,他们应该聚在一起。,注意邻接矩阵需要为正数,否则报错,所以我们下面用了指数。

2023-10-22 20:25:59 1455

原创 latex如何设置字体大小

通常,下面这些控制字体大小的命令就够用了。那么hello就会使正常字体大小。

2023-10-18 11:44:22 2227 1

原创 (完全解决)latex如何设置某段文字向右对齐

也就是说不是像上上图那样,文字后面空格一大堆,然后是日期。开门见山,老子就是想要下图中日期的效果,可以看到,日期向右对齐。但是试过了好像不行,其是换一行,然后向右对齐。

2023-10-18 11:30:18 7004 2

原创 (latex中appendix附录怎么写)以及(附录里面的图片表格之类的如何重新编号)

正文可以引用附录,附录也可以引用正文,包括引用文章。这个很简单,我一开始以为很复杂。

2023-10-15 10:51:24 16358

原创 Dirac delta function (狄拉克 delta 函数)

其不是一个具体的函数,而是具有某一性质的函数的总称。比如正态分布只是一个总称,不告诉均值和方差你根本不知道它长什么样。总结就是,该函数满足积分为1,积分区间为无穷小,概率密度为无穷大,所以非常地抽象。

2023-10-14 11:29:10 250

原创 如何实现torch.arange的tensor版本

因为这样才可以保证,输出的结果的维度是一样的。步长一个是1,一个是2,这样肯定不行,两个。输出的维度不同,就肯定不可能并行。细心的人可以发现,上面是具有特殊性的,输出的维度还是会不同,无法并行。(end-start),最终。并行做,难道就不行吗?

2023-10-04 11:30:22 442

原创 会议AISTATS(Artificial Intelligence and Statistics) Latex模板参考文献引用问题

在看AISTATS2024模板的时候,发现模板里面根本没有教怎么引用,要被气死了。如下,引用的时候,模板是自己手打上去的?而且模板提供的那三个引用,根本也没有Cheesman这个人,顿时就感觉这模板谁写的,写得太烂了。

2023-09-30 16:36:56 892 1

littileprince1-5.txt

而且只选取了其5/25章来训练,模型可谓相当小,但是麻雀虽小五脏俱全。

2021-07-11

Dataset.rar

这是中文电影评论数据集,数据集还算大,大型模型可以用,小型模型使用一部分,所以也可以。数据集的质量挺高的。

2021-07-10

convert_bert_tf_checkpoint_to_pytorch.py

将基于TensorFlow的谷歌发布的官方BERT模型转化为基于Pytorch的BERT模型

2021-06-26

chinese_wwm_ext_pytorch.rar

基于pytorch的中文bert模型。

2021-06-26

chinese_L-12_H-768_A-12.rar

这是一个已经训练好的中文bert模型,参数都是可以用的参数,可以直接拿来用。这个是轻量版的,不过要注意这个是基于Tensorflow的,不过据说有可以将其转化为pytorch版本的脚本,可以自己搜一下。

2021-06-26

中国科学院大学现代智能优化方法韩丛英老师期末考试要点

中国科学院大学现代智能优化方法韩丛英老师期末考试要点

2021-05-19

国科大2020-12-30自然语言处理考试.txt

国科大2020-12-30自然语言处理考试回忆

2021-05-11

中国计算机学会推荐的国际期刊和会议,

中国计算机学会推荐的国际期刊和会议-2019年发布的。在计算机的每一个方向都分为了A,B,C类。

2021-04-29

finaltest.txt

国科大编译高级教程期末考试考点和经验

2021-03-23

emnlp2021-latex.zip

atex版本EMNLP2021论文模板lEMNLP2021论文模板lEMNLP2021论文模板lEMNLP2021论文模板l

2021-03-20

acl-ijcnlp2021-templates.zip

latex版的ACL2021论文模板ACL2021论文模板ACL2021论文模板ACL2021论文模板ACL2021论文模板ACL2021论文模板

2021-03-20

Statistic-2.6.1.rar

这个可以用来统计你的项目的代码行数,我是用在android studio中,其他开发工具中也应该都可以用。这个是一个插件,很小。

2020-04-29

使用JSON所必须的6个包

在网络数据传输的时候选择把我们的数据变成json格式是非常好的,而这个就需要这6个包的支持。这6个包可以帮忙进行生成和解析,非常方便使用。

2020-04-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除