自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 问答 (3)
  • 收藏
  • 关注

原创 python对docx文件进行处理,识别docx文件内容是否带有某个词

学校给了我一个任务,有几百个文件,有些是docx格式,有些是doc格式,有些事pdf格式!!!!!!需要注意的是,这个代码不能处理pdf和doc文件,幸好学校给我的那几百个文件里面,pdf、doc占比不是很大,因此对于这两类文件,我就是一个一个打开找的!!!!!!任务为:在这几百文件里面找出内容里面含有 “小花” 、 “大树” 、“绿草” 这些字眼的文件直接上代码,我慢慢解释from docx import Documentimport os#读取文档path='C:/U

2022-05-20 13:39:14 1011

原创 NLP对数据集进行(词性标注):将所有的词性进行汇总并且编号;将所有的英文词对应的词性转换成编号,得到list

我最近在做一个自然语言处理的作业,词性标注首先对词性标注的数据集进行处理直接上代码,我再解释一下# -*- coding: utf-8 -*-import nltkdef trans_chaToNum(tagged): pred = [] for tag in tagged: result = tag[1] pred.append(result) # 2.把字符编号,不同的字符对应不同的编号 mylist = set(p

2022-05-08 20:43:48 1042

原创 将string里的所有的标点符号全部去除,只剩下英文字母,空格和数字

python 代码功能如下:将string里的所有的标点符号全部去除,只剩下英文字母,空格和数字直接上代码:# -*- coding: utf-8 -*-import re# make English text cleandef clean_text(text): # keep English, digital and space # 就是会把标点符号全部去除掉 comp = re.compile('[^A-Z^a-z^0-9^ ]') retur

2022-05-08 09:57:29 1499

原创 cmd查看当前目录的文件及进入某文件以及安装keras-contrib

一开始打开,默认目录是:C:\Users\lenovo接下来输入dir,再按回车键,就可以看见该目录下的所有文件接下来,输入cd Desktop,再按回车键,就可以进入Desktop这个文件夹啦前缀就变了,意思就是你现在在Desktop这个文件夹了。------------------------------------------------------------------------说我篇幅太短了,那我就再继续记录一下,我为什么要进入该文件夹,因为我想安装keras_..

2022-05-07 16:38:55 3409

原创 查看.pth文件里面保存了哪些权重及那些权重的shape

废话不多说,直接上代码import torch content = torch.load('logs/ep100-loss0.253-val_loss1.945.pth',map_location=torch.device('cpu'))#torch.load('路径') 但是我的电脑没有GPU,是集成显卡呜呜呜,所以还得加个后面那部分map_location=torch.device('cpu')print(content.keys()) print(content['extr

2022-05-05 20:03:43 1903

原创 训练little wihte:events.out.tfevents到底是什么文件?

第一次训练的时候,我只知道我会把模型的参数 每25个epoch 保存在logs这个文件夹内,我一共设置了100个epoch,那就是logs文件夹会有4个 .pth文件。但是我打开文件夹的时候,发现,其中还有这个文件夹这是我没想到的(原谅我是一个小白(lll¬ω¬))我仔细看了一下。2022_05_03是日期,我确实在那天有运行过train文件,但是当时出现了很多错误,我就一直在改错,改了两天,一直在05_05 才改错完成,运行成功,所以出现了那么多文件夹。只有最后一个文件夹里面是有完好内

2022-05-05 10:02:53 6505 6

原创 将文件夹中的png、wegb图片全部转换为jpg图片

我有一堆图片,有png格式、jpg格式,还有wegb格式,幸好我一共就只有11张图片,我把wegb格式的图片自己手动转换成了jpg格式wegb-->jpg将wegb格式的图片用画图打开,再另存为jpgpng-->jpgimport os#这里的D:/RMN/VOCdevkit/VOC2007/JPEGImages 换成你自己存放图片的目录dirName = "D:/RMN/VOCdevkit/VOC2007/JPEGImages\\" #最后要加双

2022-05-03 10:16:47 503

原创 对GAN\WGAN\WGAN-GP进行一段话总结

总结:GAN网络由两部分组成:生成模型和判别模型生成模型就是输入噪点,输出逼真的样本判别模型为二分类器,判断真假更新判别模型的参数(损失函数带有log):在Discriminator中真是样本与1的loss+在D中虚假样本与0的loss然后更新生成模型的参数(损失函数带有log):在D中fake与1的lossWGAN网络就是更改了GAN的loss函数, 将loss函数中的log去掉了,并且把+改成了-WGAN中的鉴别器(D判别模型)也称为评论家WGAN删除了鉴别器的输出中.

2022-03-22 20:05:10 634

原创 Video Caption

米娜桑,哦哈哟~最近在写video caption相关综述学习video caption的时间不长,也是近一年才开始接触。说实话,也只是半吊子(〃ー〃)这一年来也没有特别特别认真的学习写这个文章也有个目的就是逼迫我努力学习(〃▽〃)我现在是上海一所大学的研一苟 一只(*ノ▽ノ)希望有大佬可以给我提提意见,指导我一下有志同道合的朋友可以一起做研究~...

2021-11-17 09:39:42 410 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除