自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Datawhale AI夏令营【从零入门CV图像竞赛】数据增强,提升模型表现

在上一次实验的基础上,我们注意到模型的性能还有提升空间,同时我们也发现原有的模型(EfficientNet-B4)参数量较小(约77M),未充分利用200M的限制。因此,本次实验我们选择了更大、更强大的模型,以期获得更好的检测效果。

2024-07-17 22:14:49 237

原创 Datawhale AI夏令营【从零入门CV图像竞赛】任务一:了解Deepfake & 初探baseline

随着深度学习技术的快速发展,Deepfake(深度伪造)技术在近年来取得了显著进步,能够生成高度逼真的虚假图像、视频和音频内容。这种技术的进步不仅为创意内容制作带来了新的可能性,同时也对信息真实性、个人隐私和公共安全构成了前所未有的威胁。在这样的背景下,本次挑战赛聚焦于Deepfake检测技术的开发和优化。这个初始版本提供了一个完整的训练流程,包括数据加载、模型训练、验证和保存最佳模型。它采用了一些基本的深度学习最佳实践,如数据增强、学习率调度和模型检查点。感觉要训练很长时间,不知道明天能不能出来。

2024-07-14 18:07:58 528

原创 【云模型部署】任务二:猫狗识别模型

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:撤销:Ctrl/Command + Z重做:Ctrl/Command + Y加粗:Ctrl/Command + B斜体:Ctrl/Command + I标题:Ctrl/Command + S

2023-11-07 23:18:15 70

原创 【组队学习】06.Pytorch可视化

在深度学习建模过程中,为了能够快速绘制模型基本结构、观察模型评估指标伴随训练过程的动态变化情况,当然也为了能够观察图像数据,我们可以使用TensorBoard工具来进行PyTorch深度学习模型的可视化展示。Tensorboard原本是TensorFlow的可视化工具,而目前在TensorboardX工具的加持下,其他深度学习计算框架也可使用TensorBoard工具进行可视化操作了。...

2022-07-22 21:48:18 715 1

原创 【组队学习】04.PyTorch进阶学习技巧

因为pytorch的动态图机制,使得循环神经网络非常方便。

2022-07-20 22:54:43 146

原创 [组队学习]03.PyTorch模型定义

当模型的前向计算为简单串联各个层的计算时,Sequential类可以通过更加简单的方式定义模型。它可以接收一个子模块的有序字典(OrderedDict)或者一系列子模块作为参数来逐一添加Module的实例,⽽模型的前向计算就是将这些实例按添加的顺序逐⼀计算。对应模块为nn.Sequential()。...

2022-07-17 21:25:39 83

原创 【组队学习】06.PyTorch的生态

组队学习02

2022-07-15 22:13:18 360

原创 【组队学习】01.PyTorch的安装和基础知识

Task01

2022-07-12 14:19:23 459 1

原创 Datawhale组队学习numpy第5章排序搜索计数及集合操作

排序,搜索和计数排序numpy.sort(a[, axis=-1, kind='quicksort', order=None]) Return a sorted copy of an array.axis:排序沿数组的(轴)方向,0表示按行,1表示按列,None表示展开来排序,默认为-1,表示沿最后的轴排序。kind:排序的算法,提供了快排’quicksort’、混排’mergesort’、堆排’heapsort’, 默认为‘quicksort’。order:排序的字段名,可指定字段排序,默认

2020-10-31 15:00:56 82

原创 Datawhale组队学习numpy第4章数学函数及逻辑函数

import numpy as npx = np.array([0.0, 10.0, 20.0, 30.0])y = np.array([1.0, 2.0, 3.0])z = x[:, np.newaxis] + yprint(z)# [[ 1. 2. 3.]# [11. 12. 13.]# [21. 22. 23.]# [31. 32. 33.]][[ 1. 2. 3.] [11. 12. 13.] [21. 22. 23.] [31. 32. 33.]]x =

2020-10-28 20:52:10 164

原创 Datawhale组队学习numpy第3章数组的操作-变形

import numpy as npx = np.array([[11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25], [26, 27, 28, 29, 30], [31, 32, 33, 34, 35]])y = x.flatprint(y)# <numpy.flatiter object at 0x00

2020-10-25 17:13:58 103

原创 Datawhale组队学习numpy第2章索引切片与迭代

import numpy as npx = np.array([[11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25], [26, 27, 28, 29, 30], [31, 32, 33, 34, 35]])r = np.array([[0, 1], [3, 4]])print(x[r])# [[[11 12 1

2020-10-23 22:23:23 100

原创 Datawhale组队学习numpy第1章数据类型及数组创建

什么是numpy?numpy是python中基于数组对象的科学计算库。 提炼关键字,可以得出numpy以下三大特点: 拥有n维数组对象; 拥有广播功能(后面讲到); 拥有各种科学计算API,任你调用;如何安装numpy?因为numpy是一个python库,所以使用python包管理工具pip或者conda都可以安装。 安装python后,打开cmd命令行,输入:import numpy as npnp.array([1,2,3]) #一维数组array([1, 2, 3])[[0

2020-10-20 22:32:32 183 2

原创 零基础入门金融风控-贷款违约预测作业5

5.1 学习目标将之前建模调参的结果进行模型融合。尝试多种融合方案,提交融合结果并打卡。(模型融合一般用于A榜比赛的尾声和B榜比赛的全程)5.2 内容介绍模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型融合后结果会有大幅提升,以下是模型融合的方式。平均:简单平均法加权平均法投票:简单投票法加权投票法综合:排序融合log融合stacking:构建

2020-09-27 22:20:43 102

原创 零基础入门金融风控-贷款违约预测作业4

4.1 学习目标学习在金融分控领域常用的机器学习模型学习机器学习模型的建模过程与调参流程完成相应学习打卡任务4.2 内容介绍逻辑回归模型:理解逻辑回归模型;逻辑回归模型的应用;逻辑回归的优缺点;树模型:理解树模型;树模型的应用;树模型的优缺点;集成模型基于bagging思想的集成模型随机森林模型基于boosting思想的集成模型XGBoost模型LightGBM模型CatBoost模型模型对比与性能评估:回归模型/树模型

2020-09-24 23:25:12 182

原创 零基础入门金融风控-贷款违约预测作业3

3.1 学习目标学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法学习特征交互、编码、选择的相应方法完成相应学习打卡任务,两个选做的作业不做强制性要求,供学有余力同学自己探索3.2 内容介绍数据预处理缺失值的填充时间格式处理对象类型特征转换到数值异常值处理基于3segama原则基于箱型图数据分箱固定宽度分箱分位数分箱离散数值型数据分箱连续数值型数据分箱卡方分箱(选做作业)特征交互特征和特征之间组合特征和特征之间衍生其他特征衍生

2020-09-21 20:45:03 255

原创 零基础入门金融风控-贷款违约预测作业2

Task2 数据分析此部分为零基础入门金融风控的 Task2 数据分析部分,带你来了解数据,熟悉数据,为后续的特征工程做准备,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工程做准备项目地址:https://github.com/datawhal

2020-09-18 21:40:11 300

原创 零基础入门金融风控-贷款违约预测作业1

import numpy as npimport pandas as pdimport osos.chdir("G:\\datawhale\\finance")train = pd.read_csv('train.csv')testA = pd.read_csv('testA.csv')train.head() id loanAmnt term interestRate installment

2020-09-15 22:35:34 176

原创 Datawhale组队学习机器学习算法第二章

Step1: 库函数导入## 基础函数库import numpy as np ## 导入画图库import matplotlib.pyplot as pltimport seaborn as sns## 导入决策树模型函数from sklearn.tree import DecisionTreeClassifierfrom sklearn import treeStep2: 训练模型##Demo演示LogisticRegression分类## 构造数据集x_fearures

2020-08-22 21:59:30 793

原创 Datawhale组队学习机器学习算法第一章

第一部分:Demo实践Step1:函数库导入## 基础函数库import numpy as np ## 导入画图库import matplotlib.pyplot as pltimport seaborn as sns## 导入逻辑回归模型函数from sklearn.linear_model import LogisticRegression##Demo演示LogisticRegression分类## 构造数据集x_fearures = np.array([[-1, -2]

2020-08-17 21:06:00 250

原创 Datawhale组队学习动手学数据分析第一章

1.1载入数据任务1:导入numpy和pandasimport numpy as npimport pandas as pdimport os任务二:载入数据(1) 使用相对路径载入cwd = os.getcwd()os.chdir("D:\datasets\Titanic")df = pd.read_csv('train.csv')df.head() PassengerId Survived Pclass

2020-08-17 16:54:25 757

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除