- 博客(152)
- 收藏
- 关注
原创 预训练模型与微调
前言:预训练模型已经火了这么久了,但作为菜本菜的我却还在用lstm。在生成任务上与同门学长用的预训练模型相比,效果差的比较明显。所以,我决定走上预训练的不归路。以下分享我的学习过程:了解模型:小说故事生成模型万事开头难,上视频:视频我喜欢看简短的从零实现GPT-2,瞎写笑傲江湖外传,金庸直呼内行_哔哩哔哩_bilibili这是一个非常简单的模型。他没有用huggingface的模型库,而是用pytorch自己搭建了一个模型。也没有用预训练的参数,而是从头开始训练。过程:1.
2022-05-10 17:08:10 6039 3
原创 dataloader中 sampler、collate_fn 和 dataset 的 getitem使用理解。
DataloaderDataLoader(dataset, sampler=None, collate_fn=None,batch_size=1, shuffle=False, num_workers=0,pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None)这里先从dataset的运行机制讲起.在dataloader按照batch进行取数据的时候, 是取出大小等同于batch size的index列表; 然后将列表列表
2021-08-06 16:08:32 2655
原创 resnet152
152是指152次卷积其中block共有3+8+36+3 = 50个每个block是由3层卷积构成的bottle_net block.共150个卷积开头一个卷积将3通道的图片提取特征。后面一个nn.AdaptiveAvgPool2d((1,1)), 就是自适应平均池化,输出维度为1.因为本来上面的各层卷积后输出的还是一个二维矩阵。图中的64,128等都是通道数,也就是二维矩阵的个数。最后要通过自适应池化将卷积最后的矩阵转换称一个1维的数。然后才能用线性层进行维度映射。进行分类。..
2021-05-13 11:07:50 2743
原创 Transformer 中的mask
transformer中的mask有两种作用:其一:去除掉各种padding在训练过程中的影响。 其二,将输入进行遮盖,避免decoder看到后面要预测的东西。1.Encoder中的mask 的作用属于第一种在encoder中,输入的是一batch的句子,为了进行batch训练,句子结尾进行了padding(P)。在输入encoder中训练的过程中,先进性多头自注意计算。在这个过程中 1)进行(q*K^T)/d_model^1/2. 2)然后要对得到的权重矩阵进行mask 3...
2021-02-18 09:43:54 14749 12
原创 python项目学习过程中的小知识点总结
小知识tensor.permute()torch.matmul(mat1,mat2)copy()和deepcopy()tensor.view( , -1):tensor.permute(dims) :维度改变函数。改变tensor维度。比如 a是:tensor.size([3,4,6]) ,则a.permute(0,2,1)的size就是tensor.size([3,6,4]) 即交换了第1,2维度。https://zhuanlan.zhihu.com/p/765831...
2020-12-04 16:26:29 694
原创 驱动云创建保存自己的环境
驱动云的环境是这样的,每次离开之后,他的环境就会变成你最初用的镜像,过程中你做的更改不会保留。但是下次用的时候或者想要提交离线任务的时候,就需要用你修改好的镜像。介绍了如何在驱动云上部署llama2以及驱动云在训练大模型的方便之处。也说到了可以直接使用驱动云现有的环境,免得自己配置环境。输出当前环境的requirements.txt,文件会默认保存在/gemini/code下。这里可以很容易的制作镜像,将自己需要的环境永久的保存下来。随后,同样点击保存当前环境,然后选择构建标准镜像。最后点击构建就可以了。
2024-04-18 23:41:35 923
原创 解决:ValidationError: 2 validation errors for DocArrayDoc returned when try to execute the RAG Search
ValidationError: 2 validation errors for DocArrayDoc returned when try to execute the RAG Search Example - 菜本菜 - Medium
2023-12-21 15:02:38 652
原创 已解决 debug: segmentation fault when importing datasets
debug: segmentation fault when importing datasets - 菜本菜 - Medium
2023-12-08 14:20:17 472
原创 解决 The ‘more_itertools‘ package is required
2.后面同样要把filter_words.py文件拿到spider下,并修改wiki中的from filter_words import filter_url 为from .filter_words import filter_url。项目地址:https://github.com/wjn1996/scrapy_for_zh_wiki。博客:https://blog.51cto.com/u_15919249/5962100。3.在wiki.py繁简转换中加判断,避免输入为空。4. 在wiki.py中修改。
2023-07-27 14:16:04 1049
原创 解决 The ‘more_itertools‘ package is required
后面同样要把filter_words.py文件拿到spider下,并修改wiki中的from filter_words import filter_url 为from .filter_words import filter_url。项目地址:https://github.com/wjn1996/scrapy_for_zh_wiki。博客:https://blog.51cto.com/u_15919249/5962100。:return: 将句子中繁体字转换为简体字之后的句子。在wiki.py中修改。
2023-07-27 14:12:07 776
原创 pytorch 训练过程中缓存不断增大 and loss.backword()占用缓存过大
total_loss += loss.cpu().detach().numpy()
2023-02-08 20:32:59 1105 1
原创 tf.contrib.training.HParams
报错:AttributeError: 'module' object has no attribute 'HParams'。
2022-07-08 10:28:19 2048
原创 不能从上一级文件调用模块 (no module named lib)
调用自定义模块出现ModuleNotFoundError: No module named ‘XXX‘的解决方案_swrdzwj的博客-CSDN博客不行的话可以考虑是不是pytest的问题pycharm中不以pytest方式运行,以普通方式运行的方法 - 宁小静 - 博客园
2022-06-09 10:49:12 221
转载 pip install d2l
from d2l import torch as d2l这个语句中torch报错的解决方法_别摆了,张同学的博客-CSDN博客_torch中的d2l
2022-05-25 10:55:57 1971
原创 已解决:json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
网上说是 json.load 和 json.loads 的问题。后来果然是,其实我根据Error提示的位置就应该看出来的!!!白浪费了大半天
2022-05-10 22:08:29 2557 1
原创 h5py文件操作
写# phrases_id_dir = "/home/ubuntu/D/lizhigang/MGISEG-lzg/data/preprocess_data/end_phrases_id.h5"# f_lb = h5py.File(phrases_id_dir, 'w')# f_lb.create_dataset('labels', dtype='uint32', data=Label)# f_lb.create_dataset('golds', dtype='uint32', data=Gold)
2022-02-28 19:34:19 479
原创 h5py合并文件
with h5py.File('table_copy.h5',mode='w') as h5fw: for h5name in glob.glob('file*.h5'): h5fr = h5py.File(h5name,'r') for obj in h5fr.keys(): h5fr.copy(obj, h5fw)
2021-11-25 16:45:21 1295 2
原创 论文笔记notion模板
https://ash-icon-968.notion.site/a7baf2af8362493f9379a9c471d15bf6
2021-11-22 13:10:05 3796
原创 argparser action
import argparseparser = argparse.ArgumentParser()parser.add_argument('-a', action='store_true', help='Store a simple value')parser.add_argument('-b', action='store_false', help='Store a constant value')args = parser.parse_args()print(args)>>>
2021-11-01 16:38:58 283
原创 Backend TkAgg is interactive backend. Turning interactive mode on.
百度有人说是import osos.environ["TOKENIZERS_PARALLELISM"] = "false"但至少对于我来说,是不管用的查了原因,出在数据上要么是torch.cat()没有指定拼接维度要么是torch.tensor是float格式,需要int格式。等去查查数据就有没有错。...
2021-09-15 09:04:12 1240
原创 pytorch将小数tensor转换成整数tensor
a = [[1.,2.],[3.,4.]]b = torch.tensor(a)# c = torch.tensor(b,dtype=torch.int)c = b.clone().type(torch.int)print(b)print(c)
2021-09-14 22:27:31 5792
转载 Error creating directory: No space left on device2021-09-02
https://blog.csdn.net/c_base_jin/article/details/86316755
2021-09-02 15:49:36 677
原创 pytorch NotImplementedError
就是在pytorch搭建模型的时候定义forward时格式错了要么就是缩进问题,要么就是拼写问题,要么就是有没有多余字符如: _forward 前面的:小短线要去掉。torch.nn的官文继承: import torch.nn as nn import torch.nn.functional as F class Model(nn.Module): def __init__(self):
2021-08-07 16:01:54 504
原创 PyTorch使用多GPU训练
device_ids = [3, 4, 6, 7]model = Module()if torch.cuda.is_available(): module = torch.nn.DataParallel(model, device_ids=device_ids) # 声明所有可用设备 model = model.cuda(device=device_ids[0]) # 模型放在主设备images = images.cuda(device=device_ids[0]) # 训练数据
2021-07-31 16:41:10 138
原创 前端学习流程
HTML----CSS3—javascript----jquery ----js高级(面向对象)及es6----框架学习----项目练手此外还有 ajax — node(glue) — vue — 小程序 — react基本都是做前后端交互的ajax:前后端交互node:vue:是一个用于构建用户界面的渐进式的JavaScript框架。......
2021-07-02 11:27:23 92
转载 黑马视频-前端学习视频资料
2020年必看的WEB前端开发学习路线!在规划之前先给大家分享几点心得哈:1. 学习,特别是在线学习,是非常辛苦的事情,为了少走弯路, 所以一定要系统学习,多借鉴与前辈们总结出来的经验。2. 不要相信任何说 一周掌握 css, 一周学完 js 等话术, 哪些只是教你怎么用,不讲解基本原理,不系统学,最后忘得快, 也不会举一反三,(除非你是复习) 因此,学习任何知识,都要系统坚持。3. 在线学习,最忌讳的一点是只听不练。 听老师讲,基本都能听得懂,但是如果不练习,忘的很快,后面知识点一综合,就
2021-07-02 10:24:59 5267
原创 python3 安装 torchtext
conda install -c derickl torchtext抄自:https://blog.csdn.net/qq_40210472/article/details/88046669
2021-06-17 21:29:34 316
原创 ERROR: After October 2020 you may experience errors when installing or updating packages.
ERROR: After October 2020 you may experience errors when installing or updating packages. This is because pip will change the way that it resolves dependency conflicts.We recommend you use --use-feature=2020-resolver to test your packages with the new re
2021-06-15 20:28:14 575
转载 已解决:【h5py】TypeError: No conversion path for dtype : dtype (U7)
原因h5py 的String类型只接受ASCII的数据,如果你是Python3或者Python使用utf-8的编码就会报错。import h5pyf = h5py.File('test.hdf', 'w')f.attrs.create('test', '1234134')>>> h5py\h5t.pyx in h5py.h5t.py_create()>>> TypeError: No conversion path for dtype: dtype('&
2021-06-10 11:08:49 2227
原创 ubuntu窗口切换被遮挡,设置窗口切换显示总在最前面
不知道有没有小伙伴发现,ubuntu中好用的alt+tab进行窗口切换的时候,有时会打开的窗口遮挡住,导致看不见这样的切换动作。在此,偶然发现:win--setting(输入) --system settings-- appearance -- behavior 勾上:Enable workspaces即可。那ubuntu如何截屏?翻我文章。...
2021-05-24 21:49:01 1990
原创 ubuntu/ Linux 截屏
如果键盘有PrtSc键:Shift + PrtSc – 获取屏幕的某个区域截图并保存到 Pictures 目录。 Alt + PrtSc –获取当前窗口的截图并保存到 Pictures 目录。 Ctrl + PrtSc – 获取整个屏幕的截图并存放到剪贴板。 Shift + Ctrl + PrtSc – 获取屏幕的某个区域截图并存放到剪贴板。 Ctrl + Alt + PrtSc – 获取当前窗口的 截图并存放到剪贴板。如果没有PrtSc键:命令行截图法:如果你的操作系统是 Ubunt
2021-05-24 15:47:53 2659
原创 Warning: coco-caption not available cider or coco-caption missing
虽然他不是个bug,但是程序他不会运行啊。所以还得解决:错误原因:不是 if __name__ == '__train__' train 是当前python文件名二是 if __name__ == '__main__'. 这才是固定搭配。
2021-05-24 09:28:14 380
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人