无穷升高的卡农-CSDN博客

原创训练自己的GPT2

比如，我把全世界所有的网页上的文本内容都整理出来，把全人类所有的书籍、论文都整理出来，然后进行训练。这个训练过程代价很大，首先模型很大，同时数据量又很大，比如GPT3参数量达到了175B，训练数据达到了45TB，训练一次就话费上千万美元。如此大代价学出来的是一个通用知识的模型，他确实很强，但是这样一个模型，可能无法在一些专业性很强的领域上取得比较好的表现，因为他没有针对这个领域的数据进行训练过。训练完成之后，推理的话，直接使用第二节里的代码，将预训练模型路径换成自己训练的模型路径就行了。

2024-01-10 21:05:24 1531 2

原创 pytorch使用GRU等做时序预测的Dataloader如何构建

无

2022-11-01 11:19:29 1861 1

原创 GAT网络为什么占用那么多的显存

GAT网络费显存的原因

2022-10-28 10:52:25 1675

原创 linux安装atari环境实录

linux安装atari环境实录第一次尝试（失败）1.创建新环境2.cmake配置2.1 安装cmake2.2 安装zlib3.安装gym[atari]遇到的问题1.apt-get2.pip3.numpy版本不对的问题4.python版本不对的问题第二次尝试（成功版）1.创建新环境（python3.7）2.安装配置cmake（第一次已经完成，这里跳过）3.在新环境下安装numpy4.安装gym[atari]5.安装新版atari_py下载成功！！！！！第一次尝试（失败）1.创建新环境命令：conda

2021-12-08 17:43:38 2514

转载 anaconda环境的常见操作

anaconda环境的常见操作1.查看、创建、删除环境2.远程访问jupyter notebook2.1首先新建一个环境（可选）2.2 安装jupyter（可选）2.3 然后生成配置文件：2.4 设置密码2.5 修改配置文件2.6 服务器端启动jupyter3.修改恢复源1.查看、创建、删除环境查看已经建立的环境：conda env list或者conda info --env创建环境：最后添加anaconda可以在创建环境时把ananconda基础的库都安装上。但是需要的时间也更长一点，尤其是网

2021-11-23 14:12:21 289

原创在github上部署自己的博客

在github上部署自己的博客1.安装以及配置2.写博客1.安装以及配置有一些东西需要提前安装，比如nodejs，git，hexo这些。可以根据这篇博客进行安装：使用GitHub+Hexo快速搭建自己的技术博客（转载）安装之后可能回遇到一些问题，比如找不到git命令，此时可能是因为没有配置环境变量，百度一下，配置之后重开cmd应该就可以了。在github上开一个github.io的博客，网上资源很多，比如：如何在 GitHub 上写博客？。很多博客都介绍的很详细。要注意的是，博客名字似乎要和用户

2021-10-24 16:58:04 1570

转载修改setup.py的源

修改setup.py的源方法一：修改文件 ~/.pydistutils.cfg为：[easy_install]index-url=https://pypi.tuna.tsinghua.edu.cn/simple方法二：直接在setup.py的同目录放置一个setup.cfg：[easy_install]index-url=https://pypi.tuna.tsinghua.edu.cn/simple结：加上配置后python setup.py install安装的时候，依赖就会

2021-10-09 14:43:53 597

转载 No matching distribution found for dataclasses==0.8

No matching distribution found for dataclasses==0.8原网址：传送门原因：也就是说python3.7不需要安装dataclasses了。而我的就是在3.7上安装dataclasses报了这个错。

2021-08-13 11:09:34 4213

原创 U-Net训练自己的数据集

U-Net训练自己的数据集1：数据准备1：数据准备标注部分不再介绍。

2021-04-08 10:21:35 9225 14

原创已知分割数据集图像的多边形边界，绘制其二值化掩膜

已知分割数据集图像的多边形边界，绘制其二值化掩膜1：需求2：思路3：完整代码1：需求对于一些分割网络，需要使用到二值化的掩膜。但是制作的数据集（非公开数据集）的图像的标注是图像里物体的多边形边界。比如：已有的是原图和标注过的边缘（json格式的文件），想要生成下面这种二值化的掩膜。当然，实际的情况是一张图里不止一个物体，可能有几十个。2：思路刚开始我的想法是暴力，遍历每一个像素，之后判断该像素是否在某一个物体的边界内，如果是，就把像素变成白色，如果不是，就变成黑色。但是这种做法十分复杂

2021-04-07 20:20:15 4765 3

原创 json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

TypeError: the JSON object must be str, bytes or bytearray, not ‘TextIOWrapper’使用json.loads()时候遇到这个错误解决办法：import jsonwith open(json_dir) as json_file: json_data = json.load(json_file)网上也有说其他方法的，不过我都试了不行，上面的代码才可以解决。...

2021-04-06 23:11:25 197

原创 Yolact训练自己的数据集

Yolact训练自己的数据集1：提前准备好自己的数据集2：下载github存储库3：修改config.py4：训练1：提前准备好自己的数据集使用labelme来制作分割数据集，但是得到的是一个个单独的json文件。需要将其转换成coco。labelme2coco.py如下所示（代码来源：github链接）：import osimport jsonimport numpy as npimport globimport shutilfrom sklearn.model_selection im

2021-04-05 14:46:17 7925 24

原创 PytorchStreamReader failed reading zip archive: failed finding central directory

原因：主要还是pytorch版本问题。高版本的torch.save保存模型时，使用的新的格式，而torch.load使用的是旧格式。不知道为啥，我在同一个环境下，先save后load也会出这个错。**解决：**加一个参数...

2021-04-05 14:32:06 21624 6

原创目标检测、图像分割的专业名词

实例分割的专业名词一：RPN二：ROI三：ROIPool四：ROIAlign五：IoU六：mAP七：FPN一：RPN全称“Region Proposal Network”，即“区域生成网络”，通俗讲是“筛选出可能会有目标的框”。其本质是基于滑窗的无类别object检测器，输入是任意尺度的图像，输出是一系列矩形候选区域。快速理解RPN二：ROI全称Region of Interest，三：ROIPool四：ROIAlign五：IoU六：mAP七：FPN...

2021-03-23 15:19:07 693

原创【LeetCode刷题】第二期

【LeetCode刷题】第二期一：1431.拥有最多糖果的孩子二：1470.重新排列数组三：1486.数组异或操作三：248.移动0四：566.重塑矩阵一：1431.拥有最多糖果的孩子class Solution: def kidsWithCandies(self, candies: List[int], extraCandies: int) -> List[bool]: maxmium = max(candies) ans = [] fo

2021-01-08 14:05:53 2102

原创【LeetCode刷题】第一期

【LeetCode刷题】第一期一：1248.统计[优美子数组]（中等）二：26.删除排序数组中的重复项（简单）三：1672.最富有客户的资产总量(简单)四：1480.一维数组的动态和（简单）五：1512.好数对的数目一：1248.统计[优美子数组]（中等）题目描述：传送门法一：暴力求解思路：把所有子数组列出来，再遍历一遍，看其中满足条件的有几个def is_odd(n): return 1 if n%2 == 1 else 0def odd_num(array): count

2021-01-03 15:28:19 204 3

转载 pandas dataframe 读取csv文件数据类型转化字符变成了数字

pandas dataframe 读取csv文件数据类型转化字符变成了数字因为csv中包含了大量的股票代码，如果是002开头的股票，比如002111，使用pd.read_csv(‘text.csv’) 则会让所有的002xxx，变成了2xxx，前面2个0不见了，当然你可以收工操作，填充那2个0。不过对于pandas大法，何须这么麻烦？直接在参数一栏设置一下即可：df＝pd.read_csv('text.csv', dtype={'code':str})这样，把你要转换的列的名字设定好， “

2020-08-22 12:08:23 14049 6

转载目标检测时出现RuntimeError: invalid argument 0: Sizes of tensors must match except in dimension 0.

RuntimeError: invalid argument 0: Sizes of tensors must match except in dimension 0.出错代码case1：每个图象的目标个数不尽相同，原始参数适用case2：图象大小不一样case3：样本数不能整除batch_size（据说）造成这个bug的原因有很多，一般都是在用pytorch读取数据时产生的，下面是几种常见的情况。出错代码dataG = ObjectDataset(image_ids, DIR_TRAIN+'/ima

2020-08-21 14:00:24 2402

原创 np.rot90()

np.rot901.功能2.参数1.功能旋转矩阵，有时用来旋转图像。2.参数import numpy as npnp.rot90(array, k)array：待旋转的矩阵k：旋转角度为90°xk（默认为1）当k为正数时，表示逆时针旋转90度xk，k取负数时，顺时针旋转。...

2020-07-07 21:52:48 3038

原创 cv2.VideoWriter()

cv2.VideoWriter前几个参数最后一个参数，视频的帧宽和帧高前几个参数博客：cv2.VideoWriter()最后一个参数，视频的帧宽和帧高这个可能经常容易写错或者忘记outVideo = cv2.VideoWriter('save_test_video.avi', fourcc, fps, (width, height))最后一个先是宽后是高。但是，你在获取一帧图像的宽和高时，比如：frame.shape它返回的是(高，宽)，所以一不小心可能就会出错。...

2020-07-07 19:10:35 2305

原创使用余弦定理计算反三角函数却报超出定义域

使用math.acos计算反三角函数却报超出定义域1.ERROR2.分析3.解决1.ERROR如上，arccos里面的数应该是[-1, 1]，理论上来说，三个点组成的三角形计算的话都应该符合这个条件，即使是三个点跑到一条直线上了。但是，有时候你还会在实际项目中碰到这种情况，那是为什么呢2.分析在实际中，比如视觉方向，一张图像中你检测出的各个点可能在任意一个位置，即便在任意一个位置你的代码也应该能够正常运行。就是因为位置太任意，导致下面的公式计算出来可能不是一个有理数，这样一来，势必在要进行约去或

2020-06-29 09:23:33 1470

原创 cv2.VideoCapture(0)从摄像头获取视频流并处理但是处理速度慢

cv2.VideoCapture从摄像头获取视频流并处理但是处理速度慢在做深度学习视觉相关项目的时候，经常会遇到无法做到实时的情况。比如处理一帧图像要3s，但是摄像头采集的视频里在这3s内，可能已经读了好几十帧（假如fps是20）。那么处理完这一帧之后，下一次cap.read()返回的是第二帧还是第62帧。source：Opencv读取摄像头缓冲区拥塞，有延迟情况下，处理最新帧的方法实际上Opencv的videocapture读取摄像头时，摄像头的每帧数据会全部存入缓冲区，每次cap.read()都是

2020-06-29 08:56:53 5659 1

原创【fork】openpose检测的多种情况(多人，单人，图像，视频，计算角度)

openpose检测的多种情况1.来源2.使用openpose检测的代码3.各种情况3.1 直接检测多人（图像）3.2 直接检测多人（视频）3.3 检测单人（图像）4.目标检测代码4.1 目标检测4.1.1 主函数内的代码4.1.2 其他直接使用代码文件的代码4.1.3 提取目标代码1.来源openpose检测的部分代码和模型来自一个存储库，具体的连接忘了，日后找到的话补上。另外，单纯的姿态检测的话不需要深度学习框架，只要有opencv即可。如果要单人检测，就需要用到目标检测算法，使用的是yolo，需

2020-06-28 16:46:24 3889 4

转载虚拟机卡死无法结束进程的解决方案

虚拟机卡死无法结束进程的解决方案1.卡死原因2.解决方案3.其他卡死情况3.1 如果是开机后黑屏的假死现像(这应该就是我误触前的情况)3.2 如果是启动后假死(这个我没试，不知道是否可行)转自：win10结束进程时拒绝访问的处理办法1.卡死原因虚拟机运行时（我是一直打不开，但是已经启动了），点击下面那个位置（启动之后是第二幅图的样子，网上搜的图），就会出现卡死，那个按键是不能点的。2.解决方案在平时的工作中，大家常常会碰到一些进程没有法响应，于是想要结束掉，可是有网友反映说结束进程时拒绝访问了

2020-06-19 10:49:36 24423

转载【机器学习】生成模型与判别模型详解

生成模型与判别模型1.定义2.通俗解释例1：猫狗分类例2：如何确定一只羊是山羊还是绵羊例3.识别一种语言是哪种语言例4.跟踪问题3.如何选择哪种模型主要来源：[白话解析] 深入浅出最大熵模型1.定义生成模型(Generative Model, GM)：先对联合概率P(x,ω)P(x, ω)P(x,ω)建模，然后再求取后验概率模型。判别模型(Discriminative Model, DM)：从数据集D中直接估计后验概率模型：P(ω1∣x)，P(ω2∣x),...,P(ωN∣x)P(ω_1 | x)

2020-06-13 09:19:58 919

100道numpy练习题

使用python怎么实现两台服务器之间怎么传递信息