Ashcici-CSDN博客

原创阿里千问大模型微调踩坑记录

问题2：Tokenizer class QWenTokenizer does not exist or is not currently imported.=False 的意思是,即使在本地目录中没有找到分词器和模型文件,也不会从远程存储库下载它们。看别的分享llama也有这种情况，是transformer版本导致的。解决：用top -c查看所有的进程，可以看到有命令行的全部kill。为Ture可以来使用带有自定义代码的模型，因此怀疑是这行代码有问题。微调使用官方给的微调代码，仅修改模型参数路径。

2023-09-26 16:02:15 1492

原创 Transformer学习笔记

Transformer应该算是现有state-of-the-art模型，各种能用到深度学习的领域都对transformer进行了一些研究，之前只是浅看了一下，回顾之前的学习发现还是有不一样的收获，因此做一个整理。（大白话，仅供自己快速回顾思考使用）编码：解码：问题：语义编码c用来记录整个序列的信息，序列长的话会损失很多信息，并且出现梯度小时问题引入了attention的encoder-decoder有多个c，不同的预测值会将注意力放在不同的c具体的实现：将固定的语义c替换成根据不同的输出变化的变化

2022-07-07 15:32:24 572 1

原创小白眼中的自动编码器

接触深度学习之初，了解到的第一种模型就是自编码器，当时的我虽然看了很多相关资料依然云里雾里，那么本篇主要整理总结一下自己眼中的自动编码器。自编码器主要由编码器和解码器构成，编码器可以将输出x转换成y，解码器再将y转换成，最后的loss是计算x和之间的差距。深度学习中，自编码器师一种无监督的神经网络模型编码：学习输入数据的隐含特征解码：用学习到的隐含特征重构原始输入数据神经网络在接受大量信息时学习是困难的，所以先从中提取出表征，再从这些表征中学习可以还原原始数据的信息，这样得到的表征就是最具代表性的高维表征。

2022-07-06 10:39:01 705

m0_54167819的博客

原创阿里千问大模型微调踩坑记录

原创 Transformer学习笔记

原创小白眼中的自动编码器

原创 mmseg查漏补缺

翻译目标检测指标之树编辑距离TEDS (Tree-Edit-Distance-based Similarity)

原创 CornerNet快速入门

原创表格识别论文阅读——《Robust Table Detection and Structure Recognition from Heterogeneous Document Images》

原创白话入门目标检测（一）

空空如也

空空如也