自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(162)
  • 收藏
  • 关注

原创 梯度下降算法在线性回归中的应用

梯度下降算法在线性回归、岭回归、LASSON回归中的应用,数学推导结合代码实现。

2024-07-18 14:46:43 360

原创 详解PEFT库中LoRA源码

详细解释了PEFT库中的LoRA微调方法源码

2024-06-30 18:29:20 416

原创 最佳学习率和Batch Size缩放中的激增现象

《Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling》论文解读,对最优学习率和Batch Size的缩放关系进行了理论证明

2024-06-28 16:30:41 443

原创 Chronos:学习时间序列的大语言模型(训练、微调代码解析)

Chronos:学习时间序列的大语言模型(训练、微调代码解析)

2024-06-27 13:33:02 934

原创 PatchMixer:一种用于长时间序列预测的Patch混合架构

PatchMixer:一种用于长时间序列预测的Patch混合架构,论文解读

2024-06-25 15:26:50 1109

原创 Chronos:学习时间序列的大语言模型(代码解析)

Chronos:学习时间序列的大语言模型(代码解析),对关键类进行了逐行代码解析,并对需要注意的地方进行了说明。

2024-05-10 12:01:00 1409 1

原创 使用PyTorch从头实现Transformer

使用PyTorch从头实现Transformer

2024-05-03 19:53:53 1346

原创 Chronos:学习时间序列的大语言模型(论文解读)

《Chronos:学习时间序列的大语言模型》论文翻译

2024-05-03 01:41:49 1367

原创 使用LoRA和QLoRA微调LLMs:数百次实验的见解

使用LoRA和QLoRA微调LLMs模型的最佳实践,以及调参建议

2024-02-13 11:14:35 1269

原创 面对不平衡二元分类问题是否需要使用SMOTE技术?

在机器学习中,面对不平衡二元分类问题是否需要使用SMOTE技术?

2024-01-21 11:35:22 1098

原创 Phi-2小语言模型QLoRA微调教程

微软发布的Phi-2模型在kaggle平台上的QLoRa微调教程

2024-01-09 16:17:01 2464 4

原创 ShuffleNet V2:高效CNN架构设计实用指南

ShuffleNet V2:高效CNN架构设计使用指南论文解读

2024-01-01 17:08:24 1820

原创 Generalized Focal Loss V1论文解读

Generalized Focal Loss V1论文解读,无成本提高检测精度

2023-12-30 17:16:35 528

原创 Approaching (Almost) Any Machine Learning Problem中译版

本文对Approaching (Almost) Any Machine Learning Problem(简称AAAMLP)进行了中文翻译

2023-08-30 11:28:39 5744 4

原创 利用MMPose进行姿态估计(训练、测试全流程)

利用MMpose进行姿态估计,对动物关键点检测模型进行微调与测试,从数据集构造开始,详细解释各模块作用,训练、测试全流程

2023-08-07 12:30:04 6986

原创 轻量级目标检测模型NanoDet-Plus微调、部署(保姆级教学)

超轻量级目标检测模型NanoDet-Plus微调、ONNRuntime部署保姆级教学!

2023-08-02 21:22:27 8908 1

原创 利用MMPreTrain微调图像分类模型

利用MMPreTrain库微调图像分类模型,讲解了配置文件的各组成部分,并说明了如何修改配置文件

2023-08-02 08:28:48 6671 1

原创 MMDetection微调RTMDet模型针对实例分割任务

使用MMDetection微调RTMDet模型,使其用于实例分割任务,并在Motorcycle Night Ride数据集上进行测试,对训练过程中可能出现的一些问题进行了说明,并给出了解决方案

2023-07-24 08:37:28 12429 4

原创 MMDeploy部署YOLOX-x模型

使用MMDeploy部署YOLOX-x模型,并进行推理

2023-07-14 19:36:10 10203 1

原创 MMDetection框架训练、测试全流程

本文主要介绍了MMDetection的训练与测试过程,在数据集Dog and Cat Detection上微调了RTMDet模型,解析了RTMDet模型,最终模型指标bbox_mAP达到了0.952。

2023-07-14 14:50:53 13863 4

原创 利用MMSegmentation微调Mask2Former模型

使用mmsegmentation对mask2former进行微调,并在西瓜数据集和组织肾小球数据集上进行演示

2023-07-14 08:00:22 17646 2

原创 数据分析实战(基础篇):从数据探索到模型解释

本文着重介绍数据分析实战的基础知识和技巧,探索从数据探索到建模再到模型解释的完整过程。内容包含数据探索、模型建立、调参技巧、SHAP模型解释

2023-07-08 20:59:04 1307

原创 MMYOLO框架标注、训练、测试全流程(补充篇)

MMYOLO框架标注、训练、测试全流程,对官方教程的一点补充

2023-07-01 21:07:37 17768 4

原创 重新审视长时间序列预测:关于线性映射的调查

重新审视长时间序列预测:关于线性映射的调查论文解读

2023-06-19 14:16:52 2995 5

原创 微调Hugging Face中图像分类模型

在kaggle平台上使用P100 GPU微调Hugging Face中图像分类模型vit-base-patch16-224

2023-06-15 23:25:41 15311 1

原创 VanillaNet:深度学习极简主义的力量

VanillaNet:深度学习极简主义的力量

2023-05-26 12:45:18 3642

原创 在Kaggle上使用Stable Diffusion进行AI绘图

在Kaggle上使用Stable Diffusion进行AI绘图

2023-05-24 15:53:59 3705 10

原创 TimesNet:用于一般时间序列分析的时间二维变化模型(代码解析)

TimesNet:用于一般时间序列分析的二维变化模型,逐行代码解析

2023-05-20 17:21:21 7399 74

原创 TimesNet:用于一般时间序列分析的时间二维变化模型

TimesNet:用于一般时间序列分析的时间二维变化模型论文解读

2023-05-15 10:28:02 4248 6

原创 在DARTS空间中进行神经架构搜索(NAS)

在DARTS空间中进行神经网络架构搜索,

2023-05-04 11:28:09 13712 4

原创 使用NNI对BERT模型进行粗剪枝、蒸馏与微调

使用NNI框架对BERT模型进行粗剪枝、蒸馏与微调

2023-05-03 19:04:23 14806 1

原创 SciencePlots用于科学绘图的Matplotlib样式库

SciencePlots用于科学绘图的Matplotlib样式库使用示例以及官方案例展示

2023-05-02 10:27:17 13745 1

原创 Vision Transformer架构Pytorch逐行实现

Vision Transformer架构pytorch逐行代码实现

2023-05-01 10:55:51 1211

原创 A Time Series is Worth 64 Words(PatchTST模型)代码解析

PatchTST模型代码解读

2023-04-28 16:02:57 8929 53

原创 减轻时间序列预测中分布偏移模块Dish-TS(使用示例)

即插即用的减轻时间序列预测中分布偏移模块Dish-TS(使用示例)

2023-04-12 11:58:17 905 7

原创 Dish - TS:减轻时间序列预测中分布偏移的一般范式

Dish-TS是一个简单而有效的、灵活的、针对时间序列预测中分布偏移的范式。Dish-TS 包括一个两阶段过程,预测前归一化,预测后反归一化。该范式建立在系数网络(CONET)之上,该系数网络将输入序列映射到系数以进行分布测量。如下图所示,Dish-TS被组织成一个双CONET框架,包括一个BACKCONET来说明输入空间(lookbacks)和一个HORICONET来说明输出空间(horizons)。在进入任何预测模型FΘF_{\Theta}FΘ​。

2023-04-11 12:13:33 2122 3

原创 OpenFE:全自动特征生成器(论文解读)

自动特征生成框架OpenFE论文解读

2023-03-14 15:23:41 2122 4

原创 自动特征生成框架OpenFE使用示例

自动化特征生成框架OpenFE使用示例,并对其参数进行了说明,根据性能和速度场景进行分别说明

2023-03-14 11:11:58 2452 4

原创 基于tsfresh包的单类时间序列特征提取

使用tsfresh包提取单类数据的时序特征

2023-03-02 11:53:27 925

原创 A Time Series is Worth 64 Words(PatchTST模型)论文解读

论文A Time Series is Worth 64 Words:Long-Time Forecasting With Tranformer解读,最新时间序列预测SOTA模型PatchTST

2023-02-18 12:49:40 10596 13

Deep Learning Tuning Playbook(中译版)

由五名研究人员和工程师组成的团队发布了《Deep Learning Tuning Playbook》,来自他们自己训练神经网络的实验结果以及工程师的一些实践建议,目前在Github上已有1.5k星。此版本为中文翻译版,提供给大家免费下载,因为本人知识水平有限,翻译过程中可能有误,随时欢迎大家指出错误,我会随时更正。

2023-01-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除