自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 RNN(一)——循环神经网络的实现

循环神经网络RNN主要体现在上下文对理解的重要性,他比传统的神经网络(传统的神经网络结构:输入层-隐藏层-输出层)更细腻温情,前面所有的输入产生的结果都对后续输出产生影响,他关注隐层每个神经元在时间维度上的成长。RNN在小数据集,低算力的情况下非常有效。

2024-07-26 15:36:49 784

原创 Datawhale AI 夏令营之NLP(二)——Transformer解决机器翻译

之前看过很多次transformer的理论知识都没学明白,包括它的框架图也不是很懂,他由一个编码器和解码器组成,编码器里面有多头注意力和前馈神经网络,分别都有残差连接,这样的n个transformer block就组成了编码器。解码器是在编码器的基础上多了带掩码的多头自注意力。

2024-07-19 13:57:24 1621

原创 Datawhale AI 夏令营之机器学习(二)——lightgbm 特征工程

机器学习模型的主要步骤为:探索性数据分析、数据预处理、提取特征、切分训练集与验证集、训练模型、预测结果。

2024-07-17 15:54:08 954

原创 Datawhale AI 夏令营之NLP(一)——机器翻译

自然语言处理(Natural Language Processing,NLP)是语言学与人工智能的分支,试图让计算机能够完成处理语言、理解语言和生成语言等任务。序列标注:比如中文分词,词性标注,命名实体识别,语义角色标注等都可以归入这一类问题。这类任务的共同点是句子中每个单词要求模型根据上下文都要给出一个分类类别;分类任务:比如我们常见的文本分类,情感计算等都可以归入这一类。这类任务特点是不管文章有多长,总体给出一个分类类别即可;

2024-07-14 12:00:00 542

原创 Datawhale AI 夏令营之机器学习(一)——时间序列模型

时间序列问题是指对按时间顺序排列的数据点进行分析和预测的问题,往往用来做未来的趋势预测。比如,基于历史股票每天的股价,预测未来股票的价格走向。

2024-07-12 17:23:56 747

原创 CNN算法(二)——稠密连接网络DenseNet

ResNet模型的核心是通过建立前面层与后面层之间的”短路连接“。而DenseNet模型,他的基本思路与ResNet一致,但它建立的是前面所有层与后面层的密集连接。

2024-07-10 16:35:47 527

原创 CNN算法(一)——残差网络ResNet-50

根据任务选择合适的模型:例如图像分类可能使用CNN,序列任务可能使用RNN或Transformer。应用正则化技术:L1、L2正则化或Dropout来减少过拟合。使用批量归一化:来加速训练并提高模型稳定性。模型集成:训练多个模型并将其集成起来,以提高整体性能。多任务学习:如果可能,使用多任务学习同时训练模型完成多个相关任务。损失函数选择:根据具体任务选择合适的损失函数,如均方误差、交叉熵等。

2024-07-04 08:58:47 1497

原创 深度学习笔记(七)——自定义加载数据集

在深度学习中,自定义加载数据集是一个常见的任务,因为很多实际项目中的数据集并不是标准的格式,或者你可能需要对数据进行一些预处理。在Python中,通常使用torch.utils.data.Dataset(PyTorch中)或类似的类(TensorFlow等)来定义你的数据集。在这个类中,你需要实现__len__和__getitem__方法。__len__方法返回数据集的长度,__getitem__方法允许你通过索引访问数据集中的每个数据点。

2024-06-25 13:37:56 691

原创 深度学习笔记(六)——YOLOv5的两个模块

目标检测涉及到物体的分类及边界框的确定。对于物体的分类用混淆矩阵衡量。对于边界框的回归用IoU(交并比)。单阶段目标检测:YOLO、SSD、Retina-Net双阶段目标检测:RCNN、SPPNet、Fast RCNN、Faster RCNN。

2024-06-13 17:20:59 739

原创 深度学习笔记(五)——VGG16

VGG-16是一种深度卷积神经网络(CNN)架构,使用可重复使用的卷积块来构造深度神经网络,用于图像分类和对象识别任务。VGG-16之所以备受关注,是因为它在ImageNet图像识别竞赛中取得了很好的成绩,展示了其在大规模图像识别任务中的有效性。

2024-05-24 17:26:58 893 1

原创 深度学习笔记(四)——动态学习率

深度学习调参过程中,当我们选定了一个合适的学习率后,经过许多轮的训练后,可能会出现准确率震荡或loss不再下降等情况,说明当前学习率已不能满足模型调优的需求。此时我们就可以通过一个适当的学习率衰减策略来改善这种现象,提高我们的精度。这种设置方式在PyTorch中被称为scheduler,也是。

2024-05-16 23:49:09 1611

原创 深度学习实战笔记(三)——CNN的卷积

这有助于缓解梯度消失和爆炸问题,并且可以使得每一层的输入数据都保持在一个合理的范围内,从而提高模型的训练速度和泛化能力。允许使用较大的学习率:批标准化可以使得每一层的输入数据分布更加稳定,从而允许使用更大的学习率进行训练。随着训练的进行,卷积核的值会逐渐调整,最终收敛到能够最佳识别特征的状态。前向传播:在训练过程中,输入数据经过卷积操作,然后通过激活函数和可能的池化操作,最终产生输出。防止梯度消失或爆炸:通过标准化每一层的输入数据分布,帮助缓解梯度消失或爆炸的问题,从而更好地训练深层网络。

2024-05-09 23:20:22 818 1

原创 深度学习实战笔记(二)——CNN

卷积层输出shape计算:计算公式:● 输入图片矩阵I大小:w×w● 卷积核Kk×k● 步长Sspo⌊sw−k2p​1⌋。

2024-04-30 13:57:11 494 1

原创 深度学习笔记(一)——调参

本周开始每周更新一篇关于机器学习实战的案例,内容包括数据获取、完整代码与解析、模型调优等。希望可以坚持下来。另外,有写的不对的地方,欢迎指出,大家一起努力吧!

2024-04-03 09:19:31 975 1

原创 论文阅读三步走(二)

前几天看到有这样的说法,健身论文喝酒面面俱到的人都精力旺盛,看到这句话狠狠共情,这说的不就是我嘛!!自律从做引体向上开始,健身完感觉全身都有使不完的劲,回来调点小酒小酌一下,大脑兴奋,顺理成章地开始看论文,我发现这样一套下来学习效率特别高。但凡有一天不健身,就算回来学习但也是看不太进去,效率大打折扣!so,强烈建议,大家觉得学习没劲的时候就起来运动,让你的大脑兴奋起来!回顾沐神的三步走:第一遍:读标题,摘要,结论三部分(读完之后感兴趣的话就往下读第二遍第三遍,否则及时换下一家)

2024-03-03 22:12:30 915

原创 论文阅读三步走

过完年了,大家都开卷啦,当然我也不能稳如老狗,虽然菜,但也要行动起来,昨天看了沐神的读论文三步走的方法,今天打算先从中文文献实践一遍,毕竟英文文献还是有点障碍的,循序渐进嘛(自我安慰法)。从万方随便找了一篇文献走一遍(其实是太菜了,不知道看哪些),话不多说,干就完事。第一遍:读标题,摘要,结论三部分(读完之后感兴趣的话就往下读第二遍第三遍,否则及时换下一家)第二遍:看方法和实验部分的一些重要图和表第三遍:读文章每一句话。读完之后问自己:如果让自己写这篇文章“我”会怎么做?

2024-02-26 17:10:11 372

原创 深度学习入门-基于Python的理论与实践

《深度学习入门-基于Python的理论与实践》这本书,封面是一个鱼的那本,如果有感兴趣的朋友可以去可看一看,他会把一些晦涩难懂的的理论比拟成生活中很容易理解的例子,讲的比较通俗易懂。很适合入门。

2023-11-30 17:08:31 151

原创 小白记录学习笔记之--大模型应用开发

以上就是今天的学习内容,坐而论道,不如起而行之!坚持吖!

2023-11-14 15:40:41 300 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除