自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 原来pip是有默认路径的。

原来是root/data1/anaconda3/envs/li_3_10/bin/pip: 这个位置的pip 自身带默认路径,然后路径就是后面这个,但后者又不存在。修改上面这个路径就行。

2024-05-09 11:21:41 302

原创 【25考研】:四川大学计算机学院24届874考研考情分析

川大计算机考研

2024-04-02 20:50:05 2728

原创 深度学习训练遇到的bug

都说是什么栈溢出了, 重复释放了, 最后发现是torch环境和显卡以及python版本不匹配。重新建一个好的环境就行了。munmap_chunk(): invalid pointer 进程已结束,退出代码134。训练了个神经网络, 一直出现下面的错误。而且是轮着出现, 每次不重样的。进程已结束,退出代码139。

2023-09-08 10:15:46 273

原创 PPO代码研究(2)

学习PPO的第二步

2023-09-05 16:31:59 286

原创 好的看完PG, 该看PPO了。

第一次接触PPO

2023-09-05 16:22:16 246

原创 【24考研】:四川大学计算机学院23届874考研考情分析

四川大学计算机考研考情分析

2023-08-31 20:35:33 1339 1

原创 四川大学874考研真题00-23

四川大学874考研真题 00-23年真题。

2023-08-31 14:23:49 1327

原创 四川大学2023年计算机考研真题874真题

四川大学874考研真题 00-23年都为回忆版

2023-08-31 14:19:14 643 1

原创 强化学习研究 PG

学习强化学习用的

2023-08-08 17:11:59 319

原创 transformer模型,文本生成任务。 self-attention结构

大家好,好久不见,终于又有机会来学习深度学习了, 这次我们通过全球人工智能大赛算法挑战赛的赛道一来学习。2023全球人工智能技术创新大赛 - 算法挑战赛赛道一的任务是通过医疗图像的文字描述来生成医生的诊断描述。这是一个典型的文本生成任务, 因此transformer终于可以要打破bert在我心中的地位, 第一次登上历史舞台了。下图很好的展现了transformer,bert和GPT的关系。transformer包括了一个encoder和一个decoder。

2023-04-07 11:18:05 1254 2

原创 删除小红点\u200b的

红点会变成这个字符。复试这个字符 回去, 查找 替换为空 就实现了删除。复制这段代码到编译器中 如clion。点上去显示\u200b 很烦人。写了几行代码,好多小红点。

2023-03-17 19:47:04 244

原创 BERT系列: tinyBERT 介绍与代码训练。

tinyBert的训练过程

2022-12-27 22:24:22 4828 4

原创 一文读懂bert结构。

BERT的结构介绍

2022-12-27 22:23:19 3873 6

原创 AUTO-CUT安装。

自己装不好 唉

2022-12-19 11:30:09 1944

原创 Hugging Face 模型下载方法一览。

hugging face 你不可或缺的工具

2022-10-24 13:42:11 25806 6

原创 2022李宏毅作业hw5 - 暂时先鸽,写hw6。

大失败 。 论文好难写好难写。

2022-10-19 21:48:52 1110 7

原创 vit的cam和注意力图: VIT模型的可解释性

VIT的热力图怎么画

2022-10-09 19:27:42 6419 6

原创 BERT训练数据,tfrecord转换,及glue数据集。

介绍tensorflow 使用的文本数据处理

2022-09-27 14:12:05 1179 4

原创 分类精度评价指标一览.

简单介绍一些分类网络的评价系数。

2022-09-16 17:26:12 2602

原创 图文,文字预训练方式长期学习ing。

预训练是怎么做的呢?

2022-06-09 13:35:01 838

原创 2022李宏毅作业hw4 - 挫败感十足的一次作业。

难难难 难于上青天 def __init__(self, data_dir, segment_len=128): self.data_dir = data_dir self.segment_len = segment_len # Load the mapping from speaker neme to their corresponding id. mapping_pa...

2022-05-30 15:11:12 4586 5

原创 2021李宏毅作业hw3 --食物分类。对比出来的80准确率。

对比学习, 半监督尝试 李宏毅作业3

2022-04-25 14:03:35 6538 4

原创 对比学习 ——simsiam 代码解析。:

2022李宏毅作业HW3 是食物的分类 ,但是我怎么尝试 再监督学习的模式下 准确率都达不到百分之60 .。半监督也感觉效果不明显。 所以 这次就想着对比学习能不能用来解决这个问题呢 。?看了一圈,感觉simsiam是对比学习里比较简单的一种方法,好像效果也不错。 所以来看一看这个东西是怎么玩的。 simsaim 是对比学习很新的文章了。 他的训练方式简单来说就是 ,一张图片 ,用不同的方式去增广后形成图片对 。 然后用一张去预测另一张。 不懂得可以看朱老师的视频。对比学习论文综...

2022-04-14 20:34:16 9906 33

原创 对于torch.tensor.scatter()这个函数的理解。

torch.tensor.scatter 解析

2022-04-14 18:22:16 671

原创 借京东图文识别baseline 来看clip训练过程。 clip是怎样练成的 。

这次轮到clip模型啦 。记笔记记笔记。背景 是 京东已经给了 图片的feature 也就是不需要我们再去抽特征 。 然后给了图片对应的标题。我们直接从clip训练开始。 dataloader, sampler = data['train'].dataloader, data['train'].sampler loss_img = nn.CrossEntropyLoss() loss_txt = nn.CrossEntropyLoss() if args.

2022-03-25 17:41:48 3927 5

原创 数据增广albumentations用法 -借例 hw3 食物分类-

previous work:开启第三个作业 食物分类 , 有的人找不到数据集地址 放一个 :ml2021spring-hw3 | Kaggle前言:这个作业 每类带标签的数据很少, 然后又是可以看到的真实的图片,一般面对这种 ,我们都需要做数据增广。 所以着part1 我们就一起来探索数据增广的方式 。先说说 我对数据增广的理解。众所周知,数据增广的方式有很多,然后我们该选哪种呢 ?好吧 我承认 我非常的想用autoaugment 但是那个需要高版本的torchvision...

2022-03-19 21:29:40 2208 2

原创 hw-2 李宏毅2022年作业2 phoneme识别 单strong-hmm详细解释。

系列文章2022李宏毅作业hw1—新冠阳性人员数量预测。_亮子李的博客-CSDN博客目录系列文章前言 : 作业二 真的很难 。而且会出现训练集没办法过拟合的情况 也就是训练集准确度没办法到百分之百 数据太多了 。 向实验室申请了一台服务器来跑这个作业,最后在kaggle上 pub达到了strong pri没有 哭了 试了好久都不太行。 但还是试着写写思路吧。git地址 和kaggle网址https://github.com/xiaolilaoli/lih...

2022-03-18 20:43:51 7964 4

原创 MAE源代码理解 part2 : 预训练调试

拿MAE预训练模型来分类

2022-03-10 14:50:16 11287 50

原创 MAE源代码理解 part1 : 调试理解法

git官方链接:GitHub - facebookresearch/mae: PyTorch implementation of MAE https//arxiv.org/abs/2111.06377下了MAE代码 完全看不懂 我要一步一步来 把这篇代码给全部理解了 。我自己觉得看大神代码很有用。 这篇文章当笔记用。一,跑示例:怎么说 一上来肯定是把demo里的代码拿出来跑一跑。但是会遇到问题。 下面时demo的代码。 第一个问题是TypeError:...

2022-03-04 20:47:59 12129 44

原创 在服务器的docker里 装anacond3深度学习环境的全流程基础向

教大家 新建docker 装环境 用pycharm连接

2022-03-03 13:52:58 4617 4

原创 2022李宏毅作业hw1—新冠阳性人员数量预测。

从非常基础的内容开始,主要是我的水平也很基础。

2022-03-01 20:09:56 8964 20

原创 2022李宏毅作业开坑。

开个李宏毅老师作业的新坑

2022-02-28 20:33:30 860

原创 关于信息熵 ,KL散度,交叉熵,一文读懂(bushi)。

也是看其他大佬的说法。比如这个信息熵是什么? - 知乎大家都知道 ,对于一个概率分布,信息熵的公式是: 表示发生的概率。定义公式我就不再赘述,已经有很多了。确实和我们的印象比较符合,一件事概率越大,他发生了,信息量就越小。太阳天天东边升,一点也不吃惊。太阳哪天从西边来了,说明人类换了东西的叫法。 我们来看一个例子。现在有一条公路,四家公司A,B,C,D负责这条公路的打扫和维护。A来的早,他从里面先选了二分之一。B来了,他占了四分之一,C来了,再选八分之一,D来了,只...

2021-11-29 16:41:24 1198

原创 关于os.listdir得到的文件乱序的问题

其实我觉得一般情况下都是有序的 但是偶尔无序就带来的危害超级大这时就需要对得到的列表排序 按名字排序也可以 :filelist.sort(key= lambda x:int(x))但注意X要是可以排序的 比如可以取他们名字的一部分 X[2:5]这样子按时间排序有时也很必要:filelist = sorted(filelist,key=lambda x: os.path.getmtime(x))...

2021-11-01 16:57:02 308

原创 做力扣时才体会到行优先和列优先的区别

之前感受不深这次写DP时特意换了行和列如图 44MS的是保持行不变 访问完一列再换48MS的是保持列不变 访问完一行再换数组列表在内存里都是一行一行存放的,固定行去访问的话就挨着访问就行固定列去访问 就只能跳着去访问了 所有时间肯定会变慢 在力扣上就是超过40的人和超过60的人的差距...

2021-10-13 10:32:56 171

原创 关于 Word2Vec 使用时遇到的一系列问题。

1 训练时model = Word2Vec(x, vector_size=250, window=5, min_count=5, workers=12, epochs=10, sg=1)

2021-06-04 17:16:49 2277 4

原创 对于计算正确率时 logits.argmax(dim=1),torch.eq(pre_label,label)

额 好像是一句非常简单的代码 ,但是作为新手 ,我是完全看不懂哎 前十眼。首先 这里的PRE label是一个 (a,b)维的张量。其中a是你的全连接输出维度,bsi

2021-05-31 11:10:58 3829

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除