晋丑丑-CSDN博客

原创好用的小而美的AI Agent

本文推荐了多种实用Agent：编程Agent（如Cursor、Windsurf）提升开发效率，垂类Agent（如Vantel、FinGPT）优化行业流程，计算机使用Agent（如Scrapybara、Operator）实现自动化操作。以及如何定制属于自己的小而美的Agent。

2025-05-23 10:54:28 752

原创从全局角度回顾Transformer白话版

由一个编码器和解码器组成，编码器里面有多头注意力和前馈神经网络，分别都有残差连接，这样的n个transformer block就组成了编码器。解码器是在编码器的基础上多了带掩码的多头自注意力。

2025-03-20 22:28:17 1061

原创 RNN（一）——循环神经网络的实现

循环神经网络RNN主要体现在上下文对理解的重要性，他比传统的神经网络（传统的神经网络结构：输入层-隐藏层-输出层）更细腻温情，前面所有的输入产生的结果都对后续输出产生影响，他关注隐层每个神经元在时间维度上的成长。RNN在小数据集，低算力的情况下非常有效。

2024-07-26 15:36:49 1302 1

原创 Datawhale AI 夏令营之NLP（二）——Transformer解决机器翻译

之前看过很多次transformer的理论知识都没学明白，包括它的框架图也不是很懂，他由一个编码器和解码器组成，编码器里面有多头注意力和前馈神经网络，分别都有残差连接，这样的n个transformer block就组成了编码器。解码器是在编码器的基础上多了带掩码的多头自注意力。

2024-07-19 13:57:24 1876

原创 Datawhale AI 夏令营之机器学习（二）——lightgbm 特征工程

机器学习模型的主要步骤为：探索性数据分析、数据预处理、提取特征、切分训练集与验证集、训练模型、预测结果。

2024-07-17 15:54:08 1090

原创 Datawhale AI 夏令营之NLP（一）——机器翻译

自然语言处理（Natural Language Processing，NLP）是语言学与人工智能的分支，试图让计算机能够完成处理语言、理解语言和生成语言等任务。序列标注：比如中文分词，词性标注，命名实体识别，语义角色标注等都可以归入这一类问题。这类任务的共同点是句子中每个单词要求模型根据上下文都要给出一个分类类别；分类任务：比如我们常见的文本分类，情感计算等都可以归入这一类。这类任务特点是不管文章有多长，总体给出一个分类类别即可；

2024-07-14 12:00:00 608

原创 Datawhale AI 夏令营之机器学习（一）——时间序列模型

时间序列问题是指对按时间顺序排列的数据点进行分析和预测的问题，往往用来做未来的趋势预测。比如，基于历史股票每天的股价，预测未来股票的价格走向。

2024-07-12 17:23:56 823

原创 CNN算法（二）——稠密连接网络DenseNet

ResNet模型的核心是通过建立前面层与后面层之间的”短路连接“。而DenseNet模型，他的基本思路与ResNet一致，但它建立的是前面所有层与后面层的密集连接。

2024-07-10 16:35:47 660

原创 CNN算法（一）——残差网络ResNet-50

根据任务选择合适的模型：例如图像分类可能使用CNN，序列任务可能使用RNN或Transformer。应用正则化技术：L1、L2正则化或Dropout来减少过拟合。使用批量归一化：来加速训练并提高模型稳定性。模型集成：训练多个模型并将其集成起来，以提高整体性能。多任务学习：如果可能，使用多任务学习同时训练模型完成多个相关任务。损失函数选择：根据具体任务选择合适的损失函数，如均方误差、交叉熵等。

2024-07-04 08:58:47 2611

原创深度学习笔记（七）——自定义加载数据集

在深度学习中，自定义加载数据集是一个常见的任务，因为很多实际项目中的数据集并不是标准的格式，或者你可能需要对数据进行一些预处理。在Python中，通常使用torch.utils.data.Dataset（PyTorch中）或类似的类（TensorFlow等）来定义你的数据集。在这个类中，你需要实现__len__和__getitem__方法。__len__方法返回数据集的长度，__getitem__方法允许你通过索引访问数据集中的每个数据点。

2024-06-25 13:37:56 852

原创深度学习笔记（六）——YOLOv5的两个模块

目标检测涉及到物体的分类及边界框的确定。对于物体的分类用混淆矩阵衡量。对于边界框的回归用IoU(交并比）。单阶段目标检测：YOLO、SSD、Retina-Net双阶段目标检测：RCNN、SPPNet、Fast RCNN、Faster RCNN。

2024-06-13 17:20:59 930

原创深度学习笔记（五）——VGG16

VGG-16是一种深度卷积神经网络（CNN）架构，使用可重复使用的卷积块来构造深度神经网络，用于图像分类和对象识别任务。VGG-16之所以备受关注，是因为它在ImageNet图像识别竞赛中取得了很好的成绩，展示了其在大规模图像识别任务中的有效性。

2024-05-24 17:26:58 972 1

原创深度学习笔记（四）——动态学习率

深度学习调参过程中，当我们选定了一个合适的学习率后，经过许多轮的训练后，可能会出现准确率震荡或loss不再下降等情况，说明当前学习率已不能满足模型调优的需求。此时我们就可以通过一个适当的学习率衰减策略来改善这种现象，提高我们的精度。这种设置方式在PyTorch中被称为scheduler，也是。

2024-05-16 23:49:09 2154

原创深度学习实战笔记（三）——CNN的卷积

这有助于缓解梯度消失和爆炸问题，并且可以使得每一层的输入数据都保持在一个合理的范围内，从而提高模型的训练速度和泛化能力。允许使用较大的学习率：批标准化可以使得每一层的输入数据分布更加稳定，从而允许使用更大的学习率进行训练。随着训练的进行，卷积核的值会逐渐调整，最终收敛到能够最佳识别特征的状态。前向传播：在训练过程中，输入数据经过卷积操作，然后通过激活函数和可能的池化操作，最终产生输出。防止梯度消失或爆炸：通过标准化每一层的输入数据分布，帮助缓解梯度消失或爆炸的问题，从而更好地训练深层网络。

2024-05-09 23:20:22 870 1

原创深度学习实战笔记（二）——CNN

卷积层输出shape计算：计算公式：● 输入图片矩阵I大小：w×w● 卷积核Kk×k● 步长Sspo⌊sw−k2p1⌋。

2024-04-30 13:57:11 548 1

原创深度学习笔记（一）——调参

本周开始每周更新一篇关于机器学习实战的案例，内容包括数据获取、完整代码与解析、模型调优等。希望可以坚持下来。另外，有写的不对的地方，欢迎指出，大家一起努力吧！

2024-04-03 09:19:31 1297 1

原创论文阅读三步走（二）

前几天看到有这样的说法，健身论文喝酒面面俱到的人都精力旺盛，看到这句话狠狠共情，这说的不就是我嘛！！自律从做引体向上开始，健身完感觉全身都有使不完的劲，回来调点小酒小酌一下，大脑兴奋，顺理成章地开始看论文，我发现这样一套下来学习效率特别高。但凡有一天不健身，就算回来学习但也是看不太进去，效率大打折扣！so，强烈建议，大家觉得学习没劲的时候就起来运动，让你的大脑兴奋起来！回顾沐神的三步走：第一遍：读标题，摘要，结论三部分（读完之后感兴趣的话就往下读第二遍第三遍，否则及时换下一家）

2024-03-03 22:12:30 1011 1

原创论文阅读三步走

过完年了，大家都开卷啦，当然我也不能稳如老狗，虽然菜，但也要行动起来，昨天看了沐神的读论文三步走的方法，今天打算先从中文文献实践一遍，毕竟英文文献还是有点障碍的，循序渐进嘛（自我安慰法）。从万方随便找了一篇文献走一遍（其实是太菜了，不知道看哪些），话不多说，干就完事。第一遍：读标题，摘要，结论三部分（读完之后感兴趣的话就往下读第二遍第三遍，否则及时换下一家）第二遍：看方法和实验部分的一些重要图和表第三遍：读文章每一句话。读完之后问自己：如果让自己写这篇文章“我”会怎么做？

2024-02-26 17:10:11 570 1