追逐着明-CSDN博客

原创 Datawhale AI 夏令营 CV方向 Task03总结

也就是说，我们想让结果输出的内容更加规范，因此，适当提高一些门槛，让模型输出的随机性的内容变少一些。在实战中我们会发现，在CV中检测的框架会出现很多的框，这可能是因为容错的范围比较大，造成只要高于某一个置信度的内容就都会输入进去，造成检测的目标过多，从而导致随机性比较大。momentum作为深度学习的梯度下降中对抗鞍点的方法，优化方法则成为梯度下降所需要的实现工具，分为SGD和Adam两种优化器。通常YOLO不经过任何图像尺寸上的变化所拥有的信息是最全的，因此直接按照题目要求将输入的图像的尺寸填入即可。

2024-08-31 20:28:33 404

原创 Datawhale AI 夏令营 CV方向 Task02总结

如果我们改用其他的方法，例如说Two-Stage方法，那么在运算的时间上可能就会更长，因为赛题目标是为了在视频流中检测，需要一定的时间空间去处理。候选区域生成：在某些检测算法中，如基于区域的卷积神经网络（R-CNN）及其变体，首先需要生成图像中的候选区域，这些区域可能包含感兴趣的物体。区域分类和边界框回归：对于每个候选区域，算法需要判断它是否包含特定类别的物体，并预测物体的边界框。1、为了提升识别率，我们可以考虑更换模型，比如说YOLO系列的模型中，不同的参数决定模型的性能。

2024-08-29 21:50:04 894

原创 Datawhale AI 夏令营 CV方向 Task01总结

边界框的大小与位置可以用4个值来表征： (x, y, w, h) ，其中 (x, y) 是边界框的中心坐标，而 w 和 h 是边界框的宽与高。以在照片中寻找狗为例，框架的大小可以寻找狗的特征，通过多个特征中心的确定来联合确定这是一只狗，通过一个特征出发向周围扩展。对目标二分类的结果，即目标是否在这张照片里面，通过寻找目标对应的特征（至于这个特征是什么应该是一个黑盒子问题），来判断。（1）由于YOLO格式最后标出来的是矩形，因此，对于那些非正多边形的目标框架，标注的框架可能在覆盖上不会有太好的结果。

2024-08-24 13:01:08 865

原创 Datawhale AI 夏令营 AI+逻辑推理 Task04总结

规划部分，主要涉及到推理的内容，而推理可以通过多种提示方法来引发和增强LLM的推理能力。总体来说，一个好的模型比微调做的很多努力要好很多，不过对于接下来的比赛而言，更重要的是学会对模型进行微调（Docker不允许提交参数过多的模型，同时也不允许调用模型的API）。Docker是一个开源的应用引擎，可以用来管理自己的应用部署，其可以支持很多种应用例如Web应用、大数据应用、数据库应用等。A.使用另外一个Agent训练对结果的打分，原来的Agent需要同时给出理由，根据Agent的反馈结果给到最高分。

2024-08-03 21:37:10 793

原创 Datawhale AI 夏令营 AI+逻辑推理 Task03总结

这是一个通过时间换空间的优化措施，它将多个Batch训练数据的梯度进行累积，在达到指定累积次数后，使用累积梯度统一更新一次模型参数，以达到一个较大Batch Size的模型训练效果。在深度学习中，其在模型训练过程中更新权重的速度与方向。由于在模型微调的过程中，很可能会出现模型的参数量过多，导致超过平台的最大内存，因此，我们需要在运行过程中手动清理内存（采用逐个cell运行的方式）。引入一个低秩矩阵，让模型能够进行增量微调，在不改变原有梯度的情况下，引入AB两个参数，通过调节其学习率从而实现微调的效果。

2024-08-02 17:27:30 854

原创我的创作纪念日（512天）

这一个学期，经过了算法竞赛的拷打，从华为软件精英挑战赛，到蓝桥杯，有过挫折，也有过喜悦（更多的还是在没有AC题目中的状态）。蓝桥杯的国三，也算是见证我有一定的实力（虽然还远远不足以和ICPC区域赛甚至Final的大佬们来比）然而，面对大学生就业难的问题，当前的技术水平仍然不足以应对市场上的需求。目前还是0项目经验，这也是在求职上比较占劣势的地方。毕竟，计算机这一个行业，真的蛮卷的。

2024-08-01 09:28:53 232

原创 Datawhale AI 夏令营 AI+逻辑推理 Task02 总结

于是，找到了代码的这一行。由于是第一次使用大模型，关于token之类的没有太多的关注。从模型上来看,带有instruct的模型，或者说标明的参数越多的服务会更加的好，参数多的表现性能可能会更好（好模型还是要留在最后上分时使用滴！在一个时刻，我们如果有太多的指令需求要处理，如果还是按照单线程（正常指令的处理方式，即一个一个去处理），那么就会降低处理效率，导致处理速度过于缓慢。因为在答案的填写过程中，有一部分题目的答案是缺失的（即大模型也不清楚答案），所以这个时候需要用蒙的策略（毕竟是选择题），填入答案。

2024-07-30 10:24:59 1097

原创 Datawhale AI 夏令营 AI+逻辑推理 Task01总结

4.推理阶段: 在测试或应用阶段，模型接收新的问题和选项，将其转换为相应的向量表示，然后通过模型进行预测，得到每个选项的得分或概率分布，最后选择得分最高的选项作为答案。【注：①词袋模型：将文章以词为基础进行切分，将每一篇文章看成一袋子的单词（即单词集合，忽略顺序），将文章表示为一个向量，每一维代表一个单词，权重为重要程度。对于给的Baseline而言，我们发现它并不需要给的训练数据而是直接输出，是因为它所背后的做题逻辑为通义千问给的大模型训练模型，因此直接调用相关模型即可。

2024-07-26 10:50:27 586

原创 Datawhale AI 夏令营自然语言处理 Task03总结

作为对他即将出版的著作的一个预览，他给出了从自己一身经历总结出的几个忠告 -- 告诫我们奇迹和创造力是科学生活的中心。（摄于 TEDMED）经过上一次的Task02的Baseline代码之后，我们得到的得分为3.9088（比原来要好很多，但还有不足）。②此外，在原数据中，我们能够看到有比较隐性的脏数据（括号内加以注释的），这一些也会对机器翻译造成干扰，这直接的方法是保留原有的专业名词。③而且，有一些数据翻译结果并不是我们想要得到的（比如“The world is sound”--世界是充满声音的）

2024-07-20 22:24:53 947